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Tous les chapitres sont importants. Le premier chapitre est volontairement bref 
mais fondamental : il y aura intérêt à revenir sur les notions de langage mathématique et 
de raisonnement tout au long du cours, à l’occasion de démonstrations. Les chapitre 19 
et 20 reposent sur une synthèse de l’algèbre (linéaire) et de l’analyse (calcul différentiel et 
intégral) tout en étant assez géométriques. Le chapitre 21 (fonctions de plusieurs variables) 
appartient en pratique plutôt à un cours de deuxième année; il a été ajouté pour les 
étudiants désirant anticiper un peu ou ayant besoin, par exemple en physique, d’utiliser 
les fonctions de plusieurs variables et dérivées partielles, dès la première année. 


L'ordre des chapitres. L'ordre choisi n’est que l’un des possibles. En particulier 
on pourra vouloir traiter l’“analyse” (chapitres 12-20) en premier : pour cela on traitera 
d’abord le chapitre sur les nombres réels et complexes (ou la notion de limite est introduite 
très tôt), le principe de récurrence et on grapillera quelques notions sur les polynômes 
et l’algèbre linéaire. La séquence d’algèbre linéaire (chapitres 7-11) est très inspirée de 
la présentation par Mike Artin (Algebra, Prentice-Hall 1991) mais on peut choisir bien 
d’autres présentations. On pourra aussi par exemple préférer étudier Z avant R et C (du 
point de vue des constructions, c’est même préférable!). Le chapitre 16 sur les fonctions 
usuelles peut être abordé à peu près à n’importe quel moment, quitte à s'appuyer sur les 


notions vues en terminale. 


Nous refusons le point de vue : “.. cet ouvrage part de zéro, nous ne 


supposons rien connu...”. Au contraire nous pensons qu'il faut s’appuyer sur les con- 
naissances de terminale et sur l'intuition (notamment géométrique). 11 semble parfaitement 
valable (et utile pédagogiquement) de parler de droites, courbes, plans, fonction exponen- 
tielle, logarithme, sinus, etc … avant de les avoir formellement introduit dans le cours. Il 
semble aussi dommage de se passer complètement de la notion très intuitive d’angle sous 
prétexte qu’il s’agit d’une notion délicate à définir rigoureusement (ce qui est vrai). 


Illustrations : Nous avons essayé d’agrémenter le cours d’applications et de motiva- 
tions provenant de la physique, de la chimie, de l’économie, de l’informatique, des sciences 
humaines et même de la vie pratique ou récréative. En effet nos pensons que même si 
on peut trouver les mathématiques intéressantes et belles en soi, il est utile de savoir que 
beaucoup des problèmes posés ont leur origine ailleurs, que la séparation avec la physique 
est en grande partie arbitraire et qu’il est passionnant de chercher à savoir à quoi sont 
appliquées les mathématiques. 

Indications historiques Il y a hélas peu d'indications historiques faute de temps, 
de place et de compétence mais nous pensons qu’il est souhaitable qu’un cours contienne 
des allusions : 1) au développement historique, par exemple du calcul différentiel 2) aux 
problèmes ouverts (ne serait-ce que pour mentionner leur existence) et aux problème résolus 
disons dans les dernières années. Les petites images (mathématiques et philathéliques) 
incluses à la fin de certains chapitres sont donc une invitation à une recherche historique. 


Importance des démonstrations Les mathématiques ne se réduisent pas à l’exac- 
titude et la rigueur mais quelque soit le point de vue avec lequel ont les aborde la notion de 
démonstration y est fondamentale. Nous nous efforçons de donner presque toutes les dé- 
monstrations. L’exception la plus notable est la construction des fonctions cosinus et sinus, 
pour laquelle nous utiliserons l’intuition géométrique provenant de la représentation du 
cercle trigonométrique ; l’intégrabilité des fonctions continues sera aussi en partie admise. 
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Il y a là une difficulté qui sera levée avec l’étude des fonctions analytiques (faite en seconde 
année). 

Difficulté des chapitres Elle est inégale et bien sûr difficile à évaluer. Certains 
chapitres développent essentiellement des techniques de calculs (chapitres 6, 7, 10, 16, 17, 
18, 19, 20), le chapitre 11 reprend du point de vue de l’algèbre linéaire des notions vues en 
terminales, d’autres développent des concepts (chapitres 2, 3, 4, 5, 8, 9, 12, 13, 15) et sont 
donc en ce sens plus difficiles ; le chapitre 14 est intermédiaire dans cette classification un 
peu arbitraire. Enfin le chapitre 21 n’est destiné à être appronfondi qu’en deuxième année. 

Résumés En principe les énoncés importants sont donnés sous l’entête “thèorème” 
suivis par ordre décroissant d'importance des “propositions” et des “lemmes”. Un “résu- 
mé” de chaque chapitre peut donc être obtenu en rassemblant les énoncés des théorèmes 
(et les définitions indispensables à la compréhension des énoncés). Nous avons seulement 
inclus un chapitre résumant et synthétisant les différents points de vue développés en 
algèbre linéaire (après le chapitre 11). 
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Al Khwarizmt (fin VIII, début IX°) 


CHAPITRE 1 LE LANGAGE MATHÉMATIQUE 


Ce chapitre, volontairement court, précise les modalités du raisonnement mathématique. 
En effet on n’écrit pas un texte mathématique comme un texte de langage courant : ce 
serait théoriquement possible mais totalement impraticable pour de multiples raisons (le 
raccourci des “formules” est notamment une aide précieuse pour l'esprit). 


Une définition précise le sens mathématique d’un mot ; par exemple : 


Définition: Un ensemble E est fini si il n’est pas en bijection avec lui-même privé d’un 
élement. Un ensemble est infini si il n’est pas fini. 


On voit tout de suite deux difficultés avec cet exemple : d’abord il faut avoir défini 
“ensemble” (ce que nous ne ferons pas) et “être en bijection” (ce qu’on fera au chapitre 
suivant) pour que la définition ait un sens ; ensuite il n’est pas immédiat que la définition 
donnée coïncide avec l’idée intuitive que l’on à d’un ensemble fini (c’est en fait vrai). 

Un énoncé mathématique (nous dirons simplement énoncé) est une phrase ayant un 
sens mathématique précis (mais qui peut être vrai ou faux) ; par exemple : 

(A) 1=0 

(B) Pour tout nombre réel x on a x? > 0 

(C)rŸ+ær=1 

sont des énoncés ; le premier est faux, le second est vrai, la véracité du troisième 
dépend de la valeur de la variable x. Par contre, des phrases comme “les fraises sont des 
fruits délicieux”, “j'aime les mathématiques” sont clairement subjectives. L’affirmation : 
“l'amiante est un cancérogène provoquant environ trois mille décès par an en France et 
le campus de Jussieu est floqué à l’amiante” n’est pas un énoncé mathématique, même si 
l'affirmation est exacte. Nous ne chercherons pas à définir précisément la différence entre 
énoncé mathématique et énoncé non mathématique. 

Un théorème est un énoncé vrai en mathématique ; il peut toujours être paraphrasé de 
la manière suivante : “Sous les hypothèses suivantes : ..…. , la chose suivante est toujours 
vraie :... ?. Dans la pratique certaines des hypothèses sont omises car considérés comme 
vraies à priori : ce sont les axiomes. La plupart des mathématiciens sont d'accord sur un 
certain nombre d’axiomes (ceux qui fondent la théorie des ensembles, voir chapitre suivant) 
qui sont donc la plupart du temps sous-entendus. 


Par exemple nous verrons au chapitre 5 que : 


THÉORÈME: Soit n un nombre entier qui n’est pas le carré d’un entier alors il n'existe 
pas de nombre rationnel x tel que x? = n (en d’autres termes \/n n’est pas un nombre 
rationnel). 


Pour appliquer un théorème à une situation donnée, on doit d’abord vérifier que les 
hypothèses sont satisfaites dans la situation donnée, traduire la conclusion du théorème 
dans le contexte et conclure. 

Par exemple : prenons n = 2 (puis n = 4) alors 2 n’est pas le carré d’un entier donc 
le théorème nous permet d’affirmer que V2 n’est pas un nombre rationnel. Par contre 
l'hypothèse n’est pas vérifiée pour n = 4 et le théorème ne permet pas d’affirmer que V4 
n’est pas un nombre rationnel (ce qui serait d’ailleurs bien sûr faux!). 


4 


Les connecteurs logiques permettent de fabriquer de nouveaux énoncés à partir d’au- 
tres ; nous utiliserons exclusivement les connecteurs suivants : 

non : non(A) est vrai si et seulement si (A) est faux 

ou : (À) ou (B) est vrai si et seulement si (À) est vrai ou (B) est vrai. 

et: (A) et (B) est vrai si et seulement si (A) est vrai et (B) est vrai. 

implique (en symbole =) : (A) implique (B) est vrai si et seulement si chaque fois 
que (À) est vrai alors (B) est aussi vrai. 

équivaut (en symbole &) : (A) équivaut (B) est vrai si (A) est vrai chaque fois que 
(B) est vrai et réciproquement. 

Une démonstration logique (nous dirons ensuite simplement une démonstration) est 
un énoncé, comportant éventuellement comme variable d’autres énoncés de sorte qu’il soit 
vrai quel que soit les énoncés variables. Voici des exemples de démonstration : 

Si (4) = (B) et (B) = (C) alors (4) = (C) 

non(non(A)) équivaut à (À) 

Si (A) = (B) et non(B) alors non(À). 

Si (À) ou (B) et non(B) alors (À). 

Bien entendu, les démonstrations “intéressantes” en mathématiques sont plus longues 
et sont composées de chaînes d’implications élémentaires comme celles qui précèdent. Une 
manière simple (mais fastidieuse) de vérifier ce type d’énoncé est faire un tableau avec 
les diverses possibilités : chaque énoncé est vrai ou faux (V ou F). Par exemple, pour le 
premier énoncé il y a huit possibilités : 


CE ASE B=C AC 


DR RSR 
HAS Se <t 
HS eus 
CSC RCE TE RE 
Se Se 
SSSR ee 


On constate bien que chaque fois que À = B et B = C' sont simultanément vrais alors 
A = C'est vrai aussi. 


Exemples de raisonnements parmi les plus utilisés : 


Raisonnement cas par cas : 

Schéma : si (A) ou (B), (A) = (C) et (B) = (C), alors C 
Raïisonnement par contraposée : 

Schéma : si (A) = (B), alors non(B) = non(A) 


Raisonnement par l’absurde : 
Schéma : si (B) = (A) et non(A), alors non(B). 


On voit qu'il n’y a aucune difficulté fondamentale avec les raisonnements logiques, 
la seule difficulté est parfois d’arriver à enchaîner les déductions. A titre d’exercice on 
vérifiera les déductions suivantes : 


À) ou (B)) & (non(À) et non(B)) 
À) et (B)) & (non(A) ou non(B)) 


Les quantificateurs permettent de transformer un énoncé contenant une variable en 
un énoncé “absolu” : nous utiliserons exclusivement deux quantificateurs : 

il existe (en symbole 2) 

pour tout (en symbole V) 


Exemple : considérons les énoncés suivants contenant la variable x € R. 
A(x) :x°—-1=0 
B(x) :æ?+x=x(x+1) 
C(x) 2% Flex 


L’affirmation (Vx € R non(C(x))) tout comme (1x € R A(x)) est vraie. Par contre il est 
faux que : Vx ER A(x) 


La négation de Vx A(x) est 1x non(A(x)). La négation de 2x A(x) est Vx non(A(x)). 
Par exemple la négation de : 


(A): VrER, Ve ER*, GER, VER, (r-y| <ô = |f(x) — f(y)| <e 


est : 


non(À) : ER, KER*, VER’, ER, |x -y| <ôet |f(x) — f(y) >e 


Remarque : l’énoncé (A) écrit que la fonction f est continue en tout point alors que 
non(À) écrit qu'il existe un point où f n’est pas continue (voir chapitre 13). 

Commentaires : la nécessité de la formalisation du raisonnement mathématique et 
de la notion d’ensemble a accompagné historiquement l’apparition de paradoxes au tour- 
nant de ce siècle. Ceux-ci sont essentiellement de deux types : paradoxes sémantiques et 
paradoxes logiques. 


Un exemple de paradoxe sémantique est le suivant : on choisit un dictionnaire de 
langue française et on considère l’ensemble S' des nombres entiers que l’on peut définir à 
l’aide de moins de vingt mots de ce dictionnaire. Comme le nombre de mots est fini et le 
nombre de phrase de moins de vingt mots est fini, l’ensemble S' est fini ; il existe donc “Le 
plus petit nombre entier que l’on ne peut pas définir en moins de vingt mots”. Mais nous 
venons de le définir en moins de vingt mots! 

Un exemple de paradoxe logique (dû à Russel) est le suivant : considérons l’ensemble 
S' formé de tous les éléments qui ne s’appartiennent pas à eux-mêmes ; en symboles : 


Si={x|iéx) 
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Cet ensemble à l’air inoffensif mais si on pense que S € S alors on en déduit S & S et 
inversement! 


La méthode pour éliminer les paradoxes du premier type est de se restreindre au 
langage purement mathématique (ou plus précisément de séparer langage et métalangage, 
nous ne précisons pas cette notion) : on se borne à travailler avec des notions qui peuvent 
s’écrire en langage symbolique (idéalement on pourrait penser à écrire tout en langage 
symbolique, mais on s’aperçoit vite que pour des raisons de longueur, c’est impraticable). 

La méthode pour éliminer les paradoxes du type “Russel” est de restreindre la notion 
d'ensemble ; en particulier on déclare qu’on ne peut pas former un ensemble seulement à 
partir d’un énoncé avec variables. Ainsi S := {x | A(x)} ne définit pas nécessairement un 
ensemble ; par contre, si Test un ensemble alors S := {x € T | A(x)} définit encore un 
(sous-)ensemble. 


Terminons ce premier chapitre par une description lapidaire de l’usage et de la place des 
mathématiques au sein des autres sciences. 
Un des paradigmes des sciences peut être succintement décrit par le diagramme suiv- 


ant : 
observation —— modélisation 


l l Math. 
expérience —— prédiction 

Concernant les applications des notions de ce cours en sciences indiquons par une flèche 
quelques unes des plus marquantes : 

e Algèbre et Arithmétique — informatique: 

e Théorie des groupes — chimie; 

e Calcul différentiel et intégral — physique; 

e Equations différentielles — physique, biologie, économie; 


Exercice : (logique, inégalités, ...) 

Sachant que les statistiques disponibles (code 163 de l'INSERM) indiquent 902 décès 
pour l’année 1994 par mésothéliome de la plèvre (cancer mortel, causé par l’inhalation 
de fibres d'amiante), discuter la compatibilité des déclarations suivantes du professeur 
Brochard, chercheur à l'INSERM, membre du Comité Permanent Amiante (C.P.A) : 


(a) “Le mésothéliome est un cancer rare, moins de 200 cas par an [en France}? (C.P.A, 
l’amiante et la santé, page 13, 1994). (b) “Au moins 150 mésothéliomes dus à l’amiante [par 
an en France|” (déclaration sur TF1, fin 1994). (c) “On aurait en fait 440 mésothéliomes 
par an en France” (rapport destiné au ministère du travail, novembre 1994) 


“Environ 600 mésothéliomes pleuraux en 1992, en France” (conférence internationale sur 
le mésothéliome à Créteil, 1995)(*) 


Indications : on pourra utiliser les tables de vérité et aussi le fait que le C.P.A a été créé et 
financé par les industriels de l’amiante et géré par l’agence de communnication et lobbying 
“Communications Economiques et Sociales” (C.E.S. 10 Avenue de Messine, 75008 Paris). 


&%) Post-Scriptum (1996) Le rapport INSERM sur “les effets sur la santé de l'amiante ” 
conclut qu’il y a au minimum 750 décès par an en France dus aux mésothéliomes causés 
par l’amiante. 


CHAPITRE 2 ENSEMBLES ET APPLICATIONS. 


Georg Cantor, le fondateur de la théorie des ensembles définissait un ensemble comme 
“un groupement d'objets déterminés et bien distincts, de notre perception ou de notre en- 
tendement, et que l’on appelle les éléments de l’ensemble”. Nous considèrerons la no- 
tion d’ensemble comme intuitive en gardant néanmoins en mémoire le fait qu’on ne peut 
pas considérer “n'importe quoi” comme un ensemble si l’on veut éviter les contradictions. 
Nous allons donc juste définir les opérations usuelles sur les ensembles (sous-ensembles, 
complémentaires, intersections, unions, produits, ensemble des parties) puis nous abordons 
les deux points cruciaux : la notion de fonction (ou application) qui est fondamentale dans 
toutes les mathématiques et le concept d’infini avec l’exemple fondamental : l’ensemble des 


entiers naturels, noté N, est infini. 


2.1 ENSEMBLES 


Dans la pratique il y a deux façons de construire ou décrire des ensembles : en donnant 
la liste de ses éléments, par exemple E := {0,1,2,3,5,7,8} est un ensemble, ou bien 
en décrivant une caractérisation des éléments, par exemple nous admettrons que N :— 
{n | n est un entier naturel} est un ensemble. Parmi les ensembles les plus importants nous 
étudierons outre N déjà cité, l’ensemble des nombres entiers relatifs, noté Z, l’ensemble 
des nombres rationnels, noté Q, l’ensemble des nombres réels, noté R et l’ensemble des 
nombres complexes, noté C. 


Ensemble vide : il s’agit de l’ensemble ne contenant aucun élément ; on le note ( ; on 
peut aussi le définir comme Ÿ := {x|xr#x} 


Relations entre éléments et ensembles : 

Un ensemble Æ est donc une collection d’objets qu’on appelle éléments ; pour chaque 
élément x on écrit x € E (lire “x appartient à E”). Si l'élément x n’est pas dans l’ensemble 
E on écrira x & E (lire “x n'appartient pas à E”). 

Par exemple il est clair que 4 € N et 4 é (). Quelque soit l'élément x on a toujours 
x € Ü. 

On dit qu’un ensemble E est inclus dans un autre ensemble F (ce qu’on note E € F), 
si tous les éléments de E sont aussi dans F ; en d’autres termes si x € E = x € F. Deux 
ensembles sont égaux si ils ont les mêmes éléments ; en particulier : 


ECF&aFCESE-F 


Par exemple ( € N mais les ensembles ne sont pas égaux (donc non(N C {(}) ou encore 
N gb). 
Opérations sur les ensembles : 
Sous-ensemble : si Æ est un ensemble et A(x) un énoncé avec une variable x dans E, 
on peut fabriquer l’ensemble : 
{x € ETA(x)} 


Par exemple l’ensemble des nombres entiers pairs est décrit par : 


P:={xeN|IWEN, x =2y} 
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Complémentaire : Soit F un sous-ensemble de E ; on définit le complémentaire de F 
dans Æ que l’on note C£ F (ou simplement C F si E est sous-entendu) comme l’ensemble 
des éléments de Æ qui n’appartiennent pas à F : 


Si F n’est plus nécessairement un sous-ensemble de Æ on emploiera la notation : E\F 


pour désigner {x5EeE|xéF}. 
Par exemple le complémentaire de P dans N est l’ensemble des nombres impairs : 


CNP=TI={TEN|WEN,r=2y+1} 


Intersection : si E et F sont deux ensembles on peut former un ensemble appelé leur 
intersection notée EN F' et définie par : 


ENF'={xeE|rxeF}={xeF|reE)}={x|rxeEetxer} 


Par exemple, si E = {0,1,2,3,5,7,8} et P désigne l’ensemble des entiers pairs, alors 
ÉNP=40;:2;8r 

Union : si E et F° sont deux ensembles on peut former un ensemble appelé leur union 
et notée E U F' et définie par : 


ELUF:={x|xeEouxerF} 


Par exemple si E := {0,1,2,3,5,7,8} et F :— {0,1,2,4,8,16,32} alors E U F — 
10:29,457:810.92? 

Produit : Six € E et y € F on peut fabriquer un nouvel élément appelé couple et 
noté (x,y), caractérisé par le fait que (x,y) = (z,t) si et seulement si x = z et y = t. 
L'ensemble de ces couples s’appelle le produit (cartésien) de Æ et F et se note : 


ExF:={(xy)|reEetyer} 
Pour se représenter un produit cartésien on aura avantage à avoir en tête l’exemple 


suivant : soit Æ := [0,3] (l’intervalle des nombres réels compris entre 0 et 3) et F := [0,1] 
alors E x Fest le rectangle de la figure suivante 


Un autre exemple familier est celui du plan que l’on peut représenter comme le produit 
R x R. 


Ensemble des parties : Soit E un ensemble, on peut former un nouvel ensemble dont 
les éléments sont les sous-ensembles de E et que l’on note P(E) : 


P(E):={F|FCE} 


Par exemple P((j) — {0} (ensemble avec un élément) mais on a aussi P({0,1}) = 
{0,{0},{1},{0,1}} (ensemble avec quatre éléments) 

Remarque : on notera que l’on n’a pas donné de démonstration pour l’existence de 
l’union, du produit etc. En fait il faut comprendre ces énoncés comme des axiomes i.e. des 
énoncés élémentaires que l’on admet être vrais et à partir desquels on va démontrer toutes 
les autres affirmations. Le caractère extrêmement intuitif (on a envie de dire “évident” de 
ces axiomes fait qu’ils sont admis par presque tout le monde). 

Calculs sur les ensembles : il est très important de savoir calculer et raisonner sur les 
ensembles ; il faut aussi remarquer que le calcul sur les ensembles est entièrement analogue 
au calcul sur les propositions ; en effet l’union correspond au connecteur ou, l’intersection 
correspond au connecteur et et la relation d’inclusion correspond à l’implication, prendre 
le complémentaire correspond au connecteur non : si les éléments x de À sont caractérisés 
par la propriété P(x) et ceux de B par la propriété Q(x) alors : 

Les éléments x de AU B sont caractérisés par la propriété P(x) ou Q(x). 

Les éléments x de AN B sont caractérisés par la propriété P(x) et Q(x). 

La relation À C B équivaut à l’implication Vx, P(x) = Q(x). 

Les éléments x de C£ À sont caractérisés, parmi les éléments de Æ par la propriété 


non(A(x)). 
Ainsi le calcul sur les ensembles peut toujours se ramener au calcul propositionnel ; 
voici une liste (non exhaustive) de formules où À, B,C,... sont des ensembles : 


Formulaire 


ANB=BNAet AUB = BU À (commutativité) 

AN(BNC)=(ANB)NC et AU(BUC)=(AUB)UC  (associativité) 
AN(BUC) =(ANB)U(ANC) et AU(BNC) = (AUB)N(AUC) (distributivité) 
CE(Ce À) = A 

(AC B)=(CEsBCCEAÀ) 

CE(AU BB) =Cs ANCS&B et Cg(ANB)=C£ AUCEB (loi de Morgan) 
Ax(BNC)=(AxB)Nn(AxC)et Ax(BUC)=(Ax B)U(AxC) 
(ACB)æ(CCcD)=AxCCBxD 


Démonstration:  Démontrons la première formule de distributivité : 

ze AN(BUC)ezeEeAet(xe BoureC)s(xe AetxEe Bjou(re Axe 
C\)&re(ANnB)U(ANC). 

La loi de Morgan se démontre de manière similaire : 


x EC(AUB)S non(x € AouxEe B)& non(x € À)et non(x E B)js& reCANCB 


Les autre démonstrations sont similaires et laissées en exercice. [ 


2.2 APPLICATIONS 
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Définition: Une application (ou fonction) définie sur X et à valeurs dans Ÿ est une loi 
qui, à tout élément de X fait correspondre un unique élément de Y. Si on note f cette 
application, l’élément associé à x par f est noté f(x). L'ensemble X s’appelle l’ensemble 
de départ, l'ensemble Y s'appelle l’ensemble d’arrivée de f. On note souvent une fonction 
f:X — Y ou, si les ensembles X et Ÿ sont sous-entendus x + f(x). L'élément f(x) = y 
s’appelle l’image de x par f et x s'appelle un antécédent de y par f. 


Remarque : une fonction peut être définie par son graphe, un sous-ensemble TC XXxY 
qui possède la propriété suivante : Vx € X, y € Y, (x,y) € Let de plus (x,y) E l'et 
(x,y') ET = y = y. Le graphe d’une fonction f est l’ensemble des couples (x, f(x)) pour 
x € À. 

Remarque : une phrase usuelle comme “la fonction cos(x)” comporte une ambigüité 
qui devient transparente si on augmente la phrase en “la fonction cos(x) est une bijection” 
qui est manifestement fausse si on parle d’une fonction de R dans R et néanmoins vraie 
si l’on parle d’une fonction de [0,7] vers [—-1,+1] (voir le chapitre 16). 

Remarque : on ne fait pas de distinction entre fonction et application. 


Exemples : 

L'association x + x? + 1 définit une application de R dans R. 

L'association x — /x définit une application de N dans R (mais pas de N dans N). 

L'association x + =} définit une application de R\{+1,—1} dans R. 

La loi qui associe à un point du plan IT son symétrique par rapport à un point donné 
O, définit une application de IT dans IT. 

L'association F + Cg F définit une application de P(E) dans P(E). 

L'application qui à tout élément x € X associe x s'appelle l’application identique et 
se note idx. 

Si f est une application de X dans Ÿ et si X”’ est un sous-ensemble de X, on peut 
définir f’ la restriction de f à X' par : Vx e X’, f'(x) := f(x). 


Composition : Si f : À — Y et g: Ÿ — Z sont deux applications, on peut définir la 
composée de f et g par (go f(x) = g(f(x)). Une propriété importante de la composition 
des applications est l’associativité : 


PROPOSITION: La composition des applications est associative. C'est-à-dire que si 
hR:X—Y ,g:Y —Zet f :Z — W sont trois applications, alors (fog)oh= fo(goh) 
(que l’on note donc simplement fogoh). 


Démonstration: En effet Vx € X, (fo(goh)(x) = f((goh)(x)) — f(g(h(x))) et 
((fog)oh)(x) = (fo g)(h(x)) = f(g(h(x))) sont bien égaux. D 


Exemples : Si f est donnée par x + = de R\{+1,-1} dans R et g est donnée par 
xt x? +1 de R dans R; alors go f est une application de R \ {+1,-—1} dans R décrite 
par go f(x) = (5) +1. 

Si f est la symétrie du plan IT par rapport au point O, alors f o f = idn. 

Il est souvent intéressant de décomposer une application (par exemple pour calculer 


sa dérivée) ; par exemple l’application définie par f(x) :— (er) + i)” se décompose en 
f=gohok où k(x) = cos(x), h(x) = e° et g(x) = (x +1}. 
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Il est naturel, disposant d’une fonction f d'étudier les équations du type : f(x) = f(y) 
ou encore y = f(x). Cela conduit à la notion d'application injective ou surjective. 


Définition: Une application f : X — Y est injective si (pour tout x,y € X) l'égalité 
f(x) = f(y) entraîne x = y. En d’autres termes tout élément de Y a au plus un antécédent 
ou encore est l’image d’au plus un élément de X. 


Exemple : les fonctions x - x +2 (de R dans R) et x + log(x) (de R° dans R) sont 
injectives mais les fonctions x + x? et x + sin(x) de R dans R ne sont pas injectives. 


Définition: Une application f : X — Y est surjective si, pour tout y € Y il existe 
x € X tel que y = f(x). En d’autres termes tout élément de Y a au moins un antécédent. 


Exemple : La fonction f définie par f(x) = x +2 de R dans R est surjective. La 
fonction définie par g(x) = x? de R dans R n’est pas surjective. Par contre la “même” 
fonction considérée de R dans R, est surjective. On voit donc qu'il faut bien préciser 
ensemble de départ et d’arrivée pour parler de surjectivité et d’injectivité. 


Remarque : considérons les “mêmes” fonctions mais sur des ensembles différents. Les 
fonctions x + x° restreinte à R} et x + sin(x) à l'intervalle [—T, 7] sont injectives. La 
fonction x - x? considérée de R dans R. est surjective. On voit donc qu’il faut bien 


préciser ensemble de départ et d’arrivée pour parler de surjectivité et d’injectivité. 


Définition: Une application f : À — Y est bijective si elle est à la fois injective et 
surjective. En d’autres termes tout élément de Y a exactement un antécédent. 


Exemple : La fonction f de R dans R donnée par x + x +2 est une bijection ; de 
même la fonction x + log(x) est une bijection de R* dans R. 

Lorsque f : X — Y est une bijection, on peut définir une application de Y dans X 
par la loi qui à y associe l’unique élément x tel que y — f(x) (le fait que f soit bijective 
garantit exactement l'existence et l’unicité d’un tel x). 

Définition: On appelle bijection réciproque d’une bijection f et on note f—! l’application 
caractérisée par : x = f_l(y) & y = f(x). Il est clair que f_! est aussi une bijection. 


Exemple : la bijection réciproque de x + x +2 est donnée par x + x —2. La bijection 
réciproque de x + log(x) de R* dans R est la fonction x + exp(x) de R dans R*. La 
symétrie par rapport à un point du plan est sa propre bijection réciproque. 


Définition: Soit f : E — F une application. 
i) Si À est une partie de E on appelle image directe de À par f et on note f(A) 
l’ensemble : 


J(A):={yeF|2re À, f(x) = y} 


ii) Si B est une partie de F on appelle image réciproque de B par f et on note f-!(B) 
l’ensemble : 
f'(B):={xeE] f(x) € B} 
Remarques : On prendra bien garde à ne pas confondre l'application f-! : P(F) — 
P(E) ainsi définie (qui existe pour toute fonction f) avec la bijection réciproque f”1 : 


F — E (qui n’existe que si f est bijective). 
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On pourra vérifier en exercice que : 
(i) f est surjective si et seulement si F = f(E) 
(ii) f est injective si et seulement si f : E — f(E) est une injection. 


PROPOSITION: Soit f : E — F une application, on a les formules suivantes 
(i) Pour toutes parties À, B de E 


fAUB)= f(A)UF(B), ACB= f(4)C f(B) et f(ANB)C f(A)n f(B) 


(les deux derniers ensembles sont, en général, distincts). 
(ii) Pour toutes parties À, B de F, on a f (AUB) = f-t(A)Uf-1(B), f-!(ANnB) = 
f-!(4)nf"1(B), ACB= f71(4)C f-1(B) et également f-t(Cr À) = Cerf (A) 


Démonstration: Supposons y € f(AU B) c'est-à-dire y — f(x) avec x € AU B soit 
encore x € Aou x € B ; alors y = f(x) € f(A) ou y = f(x) € f(B) donc y = f(x) € 
f(A)U f(B) ; ainsi f(AUB) € f(A)Uf(B). Si maintenant y € f(A)U f(B) alors y = f(x’) 
avec x’ € À ou bien y = f(x”) avec x” € B donc il existe x € AU B (égal à x’ ou x”) tel 
que y = f(x) donc y € f(AUB) et f(A)U f(B) € f(A)U f(B) et finalement l'égalité des 
deux ensembles. 

Supposons y € f(AN B), alors y = f(x) avec x € AN B doncx e Aety= f(x) € 
(A) mais aussi x € B donc y = f(x) € f(B) ; on peut conclure y € f(A)N f(B) et 
FAN B) € f(A)nN f(B). L'exemple suivant montre qu’on n’a pas en général égalité : 
prenons E := {a,b}, F := {c}, f(a) = f(b) = c, À := {a} et B := {b}. Alors Ü — 
f(ANB) £ F(A)N f(B) = {ce}. 

Pour changer un peu raisonnons par équivalence : x € f (AU B) équivaut à f(x) € 
AU B, qui équivaut à f(x) € À ou f(x) € B, qui équivaut à x € f {(A)ouxe f !(B), 
qui équivaut à x € f !(A)U f-1(B). Ainsi on a bien f (AUB)=/f 1(A)Uf !(B). 

On fait de même avec l'intersection ; enfin x € f (Cr À) équivaut à f(x) € Cr À, qui 
équivaut à f(x) # À ou encore non(f(x) € A), qui équivaut à non(x € f-!(A)) équivaut 
àxeCEef (4); d’où l'égalité f-!(CrA)=Csf (A). DO 


2.3 RELATION D'ORDRE ET D'EQUIVALENCE 


Une relation sur un ensemble E est un énoncé R(x,y) (ou xRy) à deux variables : si 
R(x, y) est vrai on dira que x est relié à y par la relation R. Les deux exemples les plus 
importants sont les relations d'ordre et d'équivalence. Une relation d’ordre établit une règle 
de comparaison entre tous ou certains des éléments : par exemple dans un dictionnaire 
les mots sont classés suivant une certaine loi, on peut classer les habitants d’un pays par 
ordre croissant d’âge. Une relation d'équivalence regroupe les éléments d’un ensemble par 
des propriétés mutuellement exclusives. Par exemple on peut regrouper ensemble les mots 
commençant par la même lettre, on peut séparer les habitants d’un pays d’après leur sexe, 
leur année de naissance etc. 


2.3.1 Relation d'ordre. 
Définition: Une relation d'ordre sur un ensemble Æ est une relation R telle que : 
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(i) (Réflexivité) Pour tout ze EonaxR x. 
(ii) (Transitivité) Si x R y et y R z alors x R z 
(iii) (Antisymétrie) Si x R y et y R x alors x = y. 


Remarques : ces propriétés correspondent aux propriétés de la relation “être plus 
petit que, ou égal”. En fait en mathématique la phrase “être plus petit que” doit presque 
toujours s’interpréter comme “être plus petit ou égal à”. Si l’on veut ajouter que les 
éléments sont distincts on dira “être strictement plus petit”. 


Exemples : Les ensembles N, Z, Q, R sont tous munis d’une relation d’ordre < que 
l’on peut décrire par : x < y si et seulement si y — x est positif (ou nul). Six <yet x £y 
on écrit x < y. La notion d’ordre permet de caractériser les intervalles : 


Définition: Soit E l’un des ensembles N, Z, Q ou R. Un intervalle est un sous-ensemble 
I tel que, six,yeletx <z<yalors ze l. 


Par contre l’ensemble € n’a pas de relation d’ordre naturelle et la notion d'intervalle 
n’y à pas de sens ; on peut néanmoins définir par exemple un ordre lexicographique ainsi 
(rappelons que tout nombre complexe s’écrit de manière unique x + iy avec x, y réels) : 

décrètons que x + iy R x’ +iy’ si et seulement si x < x’ ou x = x" et y < y (comme 
pour classer les mots dans un dictionnaire, on compare d’abord les premières lettres et, si 
elles sont égales on compare les secondes lettres et ainsi de suite). 

La relation d’inclusion est aussi une relation d’ordre ; en effet on a bien F C F pour 
tout ensemble F ; ss ECFet FC G alors E CGetenfnsi ECFet FC E alors 
EE, 


Il y a une différence importante entre les premiers exemples et ce dernier : dans les 
premiers cas deux éléments sont toujours comparables ; parmi deux éléments l’un est plus 
petit que l’autre. Par contre deux ensembles ne sont pas nécessairement comparables : si 
E := {0,1,2,3} et F := {0,1,4} alosonaE SF et F @ E. Ceci suggère la définition 
suivante: un ordre À sur un ensemble E est dit total (ou encore l’ensemble Æ totalement 
ordonné) si deux éléments sont toujours comparables i.e. si : 


Va,yeE, xRyouyR zx 


Par exemple : la relation sur l’ensemble N définie par x | y si et seulement si x divise y 
(ou encore y est un multiple entier de x) est une relation d'ordre (vérification laissée en 
exercice) mais ce n’est pas un ordre total ; en effet 5 ne divise pas 6 et 6 ne divise pas 5. 

Si f : À — Y est une application entre deux ensembles ordonnés par les relations < 
il est naturel de se demander si f préserve l’ordre : 


Définition: Une application f est croissante si pour tout x, y dans l’ensemble de départ 
de f, la relation x < y entraîne f(x) < f(y). Si x < y entraîne f(y) < f(x) on dit que f 
est décroissante (ou renverse l’ordre). On dit que f est monotone si elle est croissante ou 
décroissante. 


Exemples : Les fonctions de R dans R donnée par x + 2x — 3 ou x + exp(x) sont 
croissantes, l’application donnée par æz > —4x + 1 est décroissante, l’application donnée 
par æ + sin(x) n’est pas monotone (sur R). 
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Soit f : E — F une fonction, alors les applications À + f(A) (de P(E) dans P(F)) 
et Br f-1(B) (de P(F) dans P(E)) sont toutes deux croissantes (si P(E) et P(F) sont 
ordonnés par l'inclusion). 

L'importance pratique des fonctions croissantes (ou décroissantes) est qu’elles permet- 
tent de transformer des inégalités ; par exemple : 


— Érs exp(— +) < exp(z?) = —4exp( +) +12>-—-4expr(z?) +1 


Nous verrons que la méthode la plus puissante pour voir si une fonction (de R dans R) 
est monotone est le calcul différentiel. En effet nous démontrerons au chapitre 14 qu’une 
fonction dérivable sur un intervalle est monotone si et seulement si sa dérivée est de signe 
constant (résultat admis en terminale). 


2.3.2 Plus grand élément, borne supérieure. 


Une des traductions les plus fréquentes d’un problème est la recherche d’un minimum 
ou d’un maximum : si l’on veut placer son argent on cherchera naturellement à le placer 
de manière à obtenir un rendement maximum ; pour se déplacer d’un point à un autre 
on cherche le chemin le plus court ; ayant construit (ou dessiné) un pont il est important 
de connaître le poids maximal qu'il peut supporter ; de nombreux problèmes en physique 
(ou chimie) peuvent se formuler ainsi : par exemple un rayon lumineux se réfléchit ou 
se réfracte en suivant un chemin minimal (principe de Fermat) ; un solide posé sur un 
plan horizontal restera en équilibre seulement si son centre de gravité est situé dans une 
position minimale. 


Définition: Soit (E,<) un ensemble ordonné, un élément y de E est le plus grand 
élément de E si tous les autres éléments sont plus petits, c’est-à-dire si Vx € E,x < y. 


Remarque : il y a bien sûr une définition analogue du plus petit élément. 

Exemples : Le plus petit élément de N est O0 mais N n’a pas de plus grand élément. 
Considérons la relation d’inclusion sur l’ensemble P(E) ; ce n’est pas un ensemble totale- 
ment ordonné mais il a un plus petit élément : l’ensemble vide ( et un plus grand élément : 
l’ensemble E. 

Considérons maintenant un sous-ensemble F d’un ensemble ordonné E ; il est souvent 
intéressant de connaître un élément de Æ qui est plus grand que tous les éléments de F ; 
on peut aussi chercher un tel élément le plus petit possible. C’est le but des définitions 
suivantes : 


Définition: Soit F C E un sous-ensemble d’un ensemble ordonné, un élément M de E 
est un majorant de F' si pour tout x dans F on a x < M. Le plus petit des majorants de 
F (s’il existe) s’appelle la borne supérieure de F (dans E). 


On peut bien sûr définir de la même façon un minorant et la borne inférieure comme 
le plus grand des minorants. 

Exemples : Soit N CR, tout nombre réel négatif est un minorant de N et sa borne 
inférieure est donc 0 (qui est aussi le plus petit élément de N). 
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Soit E := [0,1[C R l'intervalle des nombres réels positifs et strictement plus petits 
que 1. Il est clair que 0 est la borne inférieure de Æ (et son plus petit élément) et que 1 
est sa borne supérieure bien que E n’ait pas de plus grand élément. 

Soit F := {x € Q | x < V2} considéré comme sous-ensemble de Q, alors F admet des 
majorants (par exemple 2 ou 3) mais pas de borne supérieure. En effet, si elle existait, 
la borne supérieure m de F vérifierait m°? < 2 et 2 < m? donc m? = 2, mais ceci est 
impossible (voir par exemple le chapitre 5). Bien sûr le même ensemble F, considéré 
comme sous-ensemble de R admet 2 comme borne supérieure. 

Une caractérisation commode de la borne supérieure d’un ensemble de réels est la 


suivante : 


PROPOSITION: Un réel M est la borne supérieure d’un ensemble E € R si et 
seulement si : 

()VxeE,x<M 

(ü)Ve>0,27eE, M-Ee<x 


Démonstration: En effet la première propriété dit que M est un majorant et la 
seconde que c’est le plus petit des majorants : si m est un majorant de E on voit que 
Ve > 0, M—-Ee<met donc M <m. D 


En fait nous verrons qu’une propriété très importante de R est que tout sous-ensemble 
(non vide) majoré admet une borne supérieure ; cette dernière propriété est fausse dans 
l’ensemble Q.. 


2.3.3 Relation d’équivalence. 


Définition: Une relation d'équivalence sur un ensemble Æ est une relation R telle que : 
(i) (Réflexivité) Pour tout ze EonaxR x. 
(ii) (Transitivité) Si x R y et y R z alors x R 2 
(ii) (Symétrie) Si x R y entraîne y R x. 
Exemples : Sur l’ensemble N la relation x R y si æ — y est pair définit une relation 


d'équivalence. 


Définition: La classe d'équivalence d’un élément x est l’ensemble des éléments qui lui 
sont reliés par R : 
Cœ):={yEeEl|xR y} 


Remarque : Les classes d'équivalence forment une partition de E, i.e. on peut écrire Æ 
comme union disjointe de classes d'équivalence. En effet si x,x’ € E ou bien C(x)NC{(x') — 
ÿ ou bien C{x) = C(x') (si y € C(x) NC (x) alors yRx et yYRx’ entraîne rRx'). 


Définition: L'ensemble des classes d'équivalence de Æ pour la relation R s’appelle 
l’ensemble quotient de E par R et se note E/R. 


Commentaire : il s’agit d’une notion délicate qui permet de nombreuses constructions : 
l’ensemble Z est construit à partir de N comme le quotient de N x N par la relation 
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d'équivalence (x, y)R(x',y') & x +y' = x! + y et l’ensemble Q est construit à partir de Z 
comme le quotient de Z x (Z\{0}) par la relation d'équivalence (x, y)R(x’,y') & xy! = x'y. 

Le seul exemple d'ensemble quotient que nous approfondirons est le suivant : Soit n 
un entier > 1, considérons la relation d'équivalence suivante sur Z : 


TRny & n divise x — y 


Cette relation s’appelle relation de congruence modulo n et se note souvent (Cf chapitre 
5) x = y mod n. L’ensemble quotient est un ensemble à n éléments : les classes de 
0,1,...,n — 1 et se note d'habitude Z/nZ. 


2.4 CARDINAUX ET ENTIERS NATURELS 


La notion de cardinal est probablement la première notion mathématique abstraite : il 
y a quelque chose de commun à trois carottes et trois étoiles, c’est le nombre de ces objets. 
L'idée de nombre entier est en fait issue de cette intuition. Avec les notions introduites 
précédemment on voit que deux ensembles ont même cardinal si on peut les mettre en 
bijection. Ainsi un nombre entier —-un cardinal- apparaît comme une classe d'équivalence 
d’ensembles. Ces définitions qui peuvent paraître pédantes (et le sont) quand on parle de 
cardinaux finis deviennent indispensables pour aborder les cardinaux infinis, c’est-à-dire 
pour parler du “nombre” d’éléments d’un ensemble infini. 


2.4.1 Ensembles et cardinaux finis 


Définition: Deux ensembles ont même cardinal si il existe une bijection entre les deux 
ensembles. On dit aussi qu’ils sont équipotents. 


Il s’agit bien de la traduction mathématique de “avoir le même nombre d'éléments” ; 
mais cette intuition correspond en fait au cas des ensembles finis et pour les ensembles 
infinis, la définition mathématique est la seule qui permette de raisonner. 

Cardinaux finis : un entier naturel est le cardinal d’un ensemble fini. Par exemple 
card(Ÿ) — 0, card({ÿ}) = 1, card({0, {0}}) = 2 etc. De manière plus parlante, si à, b, c, d 
sont des éléments distincts card{a} = 1, card{a,b} = 2 et card{a,b,c,d} = 4. 


Un ensemble est donc fini et de cardinal n si et seulement si il est en bijection avec 
l’ensemble {0,1,...,n—1}. 

Une propriété très importante des ensembles finis (qui en fait les caractérise) est la 
suivante : 


THÉORÈME: Soient E et F des ensembles finis de même cardinal ; soit f une 
application de E dans F alors les propriétés suivantes sont équivalentes : 

(i) L'application f est bijective. 

(ii) L'application f est injective. 

(ii) L'application f est surjective. 


Démonstration: Appelons n le cardinal de Æ. Pour que f soit surjective il faut et il 
suffit que f(E) ait n éléments, mais card(f(ÆE)) < card(ÆE) avec égalité si et seulement si 
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f est injective. On conclut que (ii) équivaut à (üi) ; par ailleurs (i) équivaut par définition 
à (üi) et (iii) d’où le théorème. D 


Remarque : On voit en particulier que si x € E et E est fini alors E \ {x} n’est pas 
en bijection avec Æ. Ceci est une caractérisation des ensembles finis. 

Une autre application simple des ensembles finis est le principe des tiroirs ; “si on range 
n + 1 chaussettes dans n tiroirs, l’un (au moins) des tiroirs contiendra deux chaussettes” 
(on laisse la preuve en exercice). 

Il est naturel, sachant qu’une ensemble est fini de chercher à déterminer son cardi- 
nal (un entier naturel). On appelle combinatoire cette partie des mathématiques. Voici 
quelques résultats utiles. 


THÉORÈME: Soient E et F des ensembles finis de cardinaux m et n respectivement, 
alors : 

(i) card(E) + card(F) = card(E N F) + card(E UF) 

(ii) card(E x F) = mn 

(üïi) Soit F(E, F) l’ensemble des applications de E vers F alors card(F(E, F)) = nn". 
En particulier card(P(ÆE)) = 2". 

(iv) Le nombre d'injection de E dans F est O0 sim > netn(n—1)(n—2)...(n—-m+1) 
sim < nn. 

(v) L'ensemble des bijections de F vers F a pour cardinal n! = n(n —1)(n —2)...2.1 


Démonstration:  (i) Commençons par observer que dans le cas plus facile où ENF = W, 
la formule est évidente ; en effet si X = AU B avec AN B — () alors card(X) — card(A) + 
card(B). Revenons au cas général et posons E’ := E\(ENF), alors E U F est union 
disjointe de F et E’ donc card(E U F) = card(F) + card(E”). Mais E est union disjointe 
de E" et ENF donc on a aussi : card(ÆE) = card(ÆE”) + card(E NF) et on tire de ces deux 
égalités la formule : card(ÆE) + card(F) = card(E NF) + card(E UF) 

(ii) On peut écrire E x F = Uzepg{x} x F ; or ces ensembles sont disjoints donc on à 
card(E x F) = Y',.#card({x} x F). Mais F est en bijection avec chacun des ensembles 
{x} x F par l’application y + (x,y) donc card({x} x F) = net card(E x F) = 5 ,epn = 
mn. 

(iii) Pour construire une fonction de E = {a1,a2,...,am} vers F il faut choisir f(a1) 
(il y an choix possibles), f(a2) (il y a n choix possibles)... .etc. I y adoncnxn...n=n" 
fonctions de E vers F. 

Soit À un sous-ensemble de Æ, on lui associe la fonction f4 : E — {0,1} définie par 
fa(x) = 1six € Aet fa(x) = Osix & À (la fonction fA4 s'appelle la fonction caractéristique 
de À). On obtient ainsi une bijection entre P(E) et F(E, {0,1}) (la bijection réciproque est 
donnée par f- {4€ E | f(x) =1}). On conclut que card(P(ÆE)) = card({0,1})7 = 2. 

(iv) Tout d’abord, il est clair que si card(ÆE) > card(F') il n'existe aucune injection de 
E dans F. Si maintenant E = {a1,a2,...,am} et m <n, pour construire une application 
injective de Æ dans F on doit choisir f(a1) € F (il y a n choix possibles) puis f(a2) € 
F\{f(a)} (Gly a n —1 choix possibles) puis f(az) € F\{f(a1), f(a2)} (il y a n —2 choix 
possibles) et ainsi de suite. On obtient donc bien en tout n(n — 1)(n —2)...(n—m +1) 
injections. 
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(v) Si E = Fest fini on sait qu’une fonction de E dans F est bijective si et seulement 
si elle est injective donc d’après le résultat précédent il y a n(n—1)(n—2)...(n—-n+1) = n! 
bijections. Cl 


Introduisons maintenant une notation très utile en combinatoire : 


Définition: Soit F un ensemble de cardinal n et soit 0 < p < n, le nombre de parties 
de F ayant p éléments se note C? ou GE 


THÉORÈME: On a les formules suivantes : 
(i) C? _ n(n=1)(n Zee p+l) n! 


p'(n—p)! 


(ii) CP = CP 
(CP = C0? HOr I 


Démonstration: (i) Un sous-ensemble à p éléments de F est donné à permutation 
près de ses éléments (il y a p! permutations d’après le théorème précédent) par une in- 
jection de {0,1,2,...,p} dans F ; il y a nn — 1)(n —2)...(n — p +1) injections et donc 
n(n—1)(n —— p+1l) 


parties à p éléments. 


Démontrons maintenant les deux propriétés (ii) et (iii). On peut bien sûr démontrer 

“J. ! Je « . . . 
ces formules en utilisant la formule CP = no (vérifiez-le à titre d'exercice) mais nous 
trouvons plus instructive une démonstration en termes d’ensembles à partir de la définition 


des CP. 


(ii) Soit E un ensemble de cardinal n. L'application À + C£ À définit une bijection 
entre l’ensemble des parties de Æ à p éléments et l’ensemble des parties de E à n —-p 
éléments, d’où la formule (ii). 


(iii) Soit E un ensemble de cardinal n et soit x € E. L'ensemble des parties de E à p 
éléments se répartit en deux sous-ensembles disjoints : l’ensemble des parties à p éléments 
de E contenant l’élément x et l’ensemble des parties à p éléments de Æ ne contenant pas 
l’élément x. Le premier est en bijection avec l’ensemble des parties à p — 1 éléments de 
E \ {x} qui a pour cardinal C?7 1, et le second est en bijection avec l’ensemble des parties 
à p éléments de E \ {x} qui a pour cardinal CŸ_,, d’où le résultat cherché. 


Remarque : Si l’on écrit dans un tableau les coefficients C? (où n sera le numéro de la 
ligne et p le numéro de la colonne), les propriétés (i) et (ii) se traduisent par la symétrie de 
chaque ligne et en observant que chaque coefficient est la somme de deux coefficients de la 
ligne précédente : celui situé juste au-dessus et son prédécesseur. Ces remarques permet- 
tent d’ailleurs de calculer très facilement les premiers coefficients. Ce tableau s’appelle le 
triangle de Pascal (bien qu’il ait été connu par exemple des mathématiciens arabes avant 
sa redécouverte par Pascal). 
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Les coefficients CP pour 0 <p <n<7: 


15 20 15 6 1 
21 35 35 21 7 1 


\l 

1 1 

Le 20e 

1 3 3 I 
1 4 6 4 I 
1 5 10 10 5 I 
1 6 

or 


2.4.2 Ensembles infinis, N et principe de récurrence. 


Nous ne donnerons pas de construction de l’ensemble N bien que celle-ci puisse se faire 
dans le cadre de la théorie des ensembles. I faut pour cela introduire l’axiome d'existence 
d’un ensemble infini. Quelque soit la présentation, l’ensemble des entiers naturels est 
le premier ensemble infini qu’on rencontre. Il peut être caractérisé par l’existence d’un 
élément initial (zéro) et pour chaque élément n d’un successeur n+1 (distinct de 0,1,...,n) 
et pour chaque élément différent de zéro d’un prédécesseur ainsi que par le principe de 
récurrence. 


Nous supposons connu donc l’ensemble : 
N := {0,1,2,3,4,5,...} 


Il est muni d’une loi d’addition et de multiplication et d’un ordre ; une loi moins évidente 
qui le caractérise essentiellement est la suivante : 


THÉORÈME: (principe de récurrence) Soit S un sous-ensemble de N contenant 0 et 
tel que : 
VneN,neS=(n+lles 


alors $ = N. 


L’utilité du théorème est de permettre de vérifier une propriété P(n) pour tout entier 
naturel n en montrant que P(n) = P(n +1) et en vérifiant P(0). 
Exemple : Démontrons que 


i=0 


Pour cela appelons P{n) cette formule et $S := {n € N | P(n)}. On voit tout de suite que 
P(0) est vrai car 0 — 0 ; supposons donc P(n) vrai et démontrons donc P(n + 1) à partir 


de P(n) : ae = Si _pi+(n+1) qui d’après P(n) vaut ee) +(n+1) = (a+D(n+2) 
soit donc : nas _ Gt) ce qui est bien P(n +1). Le théorème permet de conclure 
que $ = N ce qui signifie bien que pour tout entier n la formule P(n) est vraie. 
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Exercice : démontrer de la même manière les formules suivantes : 


nn +1)(2n +1 
Sen Jen + 1 


Pouvez-vous trouver (et prouver) une formule semblable pour > it? 
i=0 


THÉORÈME: L'ensemble N est infini. 


Démonstration: Le contraire serait surprenant, mais donnons néanmoins la démons- 
tration complète. Considérons l’ensemble N* := N \ {0} et l’application de N vers N* 
définie par n + n +1. C’est une bijection (vérification facile) mais nous avons vu qu’un 
ensemble fini ne peut pas être en bijection avec “lui-même moins un élément” donc N est 
bien infini. D 


La théorie des ensembles permet de construire à partir de N les ensembles Q, R et 
C. Nous ne développerons pas ces constructions mais signalons qu’il y a beaucoup plus de 
nombres réels que de nombres entiers ou rationnels et en particulier qu’il existe “plusieurs 
infinis” . 
Définition: Un ensemble X est dénombrable s’il existe une injection de X dans N. Il 
revient au même de dire que X est en bijection avec un sous-ensemble de N. 


THÉORÈME: (Cantor) L'ensemble Q est dénombrable. L'ensemble R n'est pas 


dénombrable. 
Démonstration: Si R était dénombrable, l'intervalle [0,1] le serait également. On 
pourrait donc écrire [0,1] = {x1,%2,...,2»,...}. Notons x, — 0,afa0) af) le 


développement décimal de x,. Pour chaque n > 1, on peut choisir un chiffre b, tel que 
Die at) et fabriquer le nombre réel x := 0,b1b2...bm.... On voit alors immédiatement 
que, pour tout n, on à x £ Zn, ce qui contredit l'hypothèse initiale. O 


Un peu d’histoire : 

Le théorème de Cantor affirme donc qu'il y a “beaucoup plus” de nombres réels que 
de nombres rationnels, en d’autre termes il n’existe pas de bijection entre Q et R. Intro- 
duisons une définition : un nombre réel est dit algébrique s'il est racine d’un polynôme à 
coefficients dans Q (ainsi 1+4V5, V4+ Ÿ2 sont des nombres algébriques) ; il est dit tran- 
scendant s’il n’est pas algébrique. L'existence de nombres transcendants n’est pas évidente 
et historiquement ils ont été découverts dans l’ordre suivant : 

Liouville montre en 1844 qu'il existe des nombres transcendants ; par exemple les 
nombres du type 0,10...010...010... où, à chaque fois, la suite de zéros est beaucoup 
plus longue que la précédente, sont transcendants. 
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Hermite prouve en 1873 que le nombre e (base du logarithme népérien) est transcen- 
dant. Il est très difficile de démontrer qu’un nombre donné est transcendant et c’est le 
premier nombre “naturel” pour lequel cela a été démontré. 

Cantor établit en 1874 que “presque tous” les nombres sont transcendants. En effet 
l’ensemble des nombres algébriques a le même cardinal que Q (ou NN). 

Lindemann montre en 1882, en adaptant la méthode de Hermite, que x est transcen- 
dant. Ce résultat achève de démontrer l’impossibilité de la quadrature du cercle. 


Pascal Blaise (1623-1662) 
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CHAPITRE 3 GROUPES, STRUCTURES ALGÉBRIQUES 


La formalisation des structures algébriques groupes, anneaux, corps, espaces vec- 
toriels— est relativement récente mais l’idée est présente partout dans les sciences et en 
particulier en mathématique. Il s’agit grosso modo d’extraire des règles opératoires, valables 
indépendemment de la nature des objets considérés. Par exemple les règles pour faire la 
somme de deux nombres, la somme de deux vecteurs du plan ou la composition de deux 
rotations sont les mêmes. L'idée sous-jacente à la notion de groupe est celle de la symétrie ; 
c’est pourquoi nous choisissons d'étudier dans une première partie les symétries de quelques 
figures simples avant d'introduire formellement la définition de groupe. 


3.1 SYMÉTRIES ET GROUPES. 


Considérons une figure simple comme un rectangle (avec sa largeur différente de sa 
longueur) : 


On distingue deux axes de symétrie : l’axe horizontal L; et l’axe vertical L2 ; on voit 
qu’on peut aussi appliquer le rectangle sur lui-même en le faisant pivoter d’un demi-tour 
autour du point © (on peut aussi interpréter cela par une symétrie par rapport au point 
O). On admettra que ce sont les seules transformations (avec l'identité!) qui appliquent 
le rectangle sur lui-même en respectant les formes. 

On vérifie sans peine les faits suivants : 

1) Appliquer deux fois la même transformation revient à appliquer l’identité 

2) Appliquer la symétrie s, par rapport à Li puis la symétrie s2 par rapport à Lo 
revient à appliquer la symétrie sQ par rapport à © ; en fait appliquer deux de ces trois 
symétries revient à appliquer la troisième (l’ordre étant indifférent). 

On peut regrouper cela dans un tableau où l’on inscrit dans la ligne de l’élément s et 
la colonne de l’élément t la composée s ot : 


oO id So 81 S2 
id id So S1 52 
50 So d S2 8: 
81 851 S2 id 80 
82 82 81 So îd 


Considérons maintenant un carré : 


Les transformations qui appliquent le carré sur lui-même, en respectant les formes, 
sont maintenant : 
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Les symétries par rapport à l’axe horizontal L; et à l’axe vertical L2 (que nous noterons 
51 et 52), les symétries par rapport à la diagonale D, et à la diagonale D, (que nous noterons 
s3 et 54), les rotations autour du point O faisant un quart de tour (que nous noterons r1), 
un demi-tour (que nous noterons r2), trois quarts de tour (que nous noterons r3), et enfin 
bien sûr l’identité. 

On vérifiera que : 1) Appliquer deux fois la même symétrie ou la rotation d’un demi- 
tour revient à appliquer l’identité ; mais appliquer deux fois la même rotation d’un quart 
ou trois quarts de tour revient à appliquer la rotation d’un demi-tour. Toutefois appliquer 
quatre fois la même rotation d’un quart ou trois quarts de tour revient à appliquer l’identité. 

2) Appliquer la symétrie par rapport à Li puis la symétrie par rapport à L2 revient 
à appliquer la rotation d’un demi-tour ; en fait appliquer deux des trois symétries revient 
à appliquer une des rotations, appliquer une des rotations et une des symétries revient à 
appliquer une des symétries. Toutefois, l’ordre n’est pas cette fois indifférent : par exemple 
S153 — T3 F T1 — S3S1. 

On peut regrouper cela dans un tableau où l’on inscrit dans la ligne de l’élément s et 
la colonne de l’élément t la composée s ot : 


O id T1] T2 T3 S1 S2 83 Sa 
id id T1 72 T3 Si S2 S3 SA 
M 1 PT T3 id S3 S4 S2 S] 
To 2 T3 id T1 S2 S1 S4 S3 
Ta T3 id T1 T2 SA S3 S1 82 
S1 S1 S4 S2 sS3 id T2 T3 T4 
S2 S2 S3 S1 S4 T2 id T1 72 
S83 83 S1 S4 S2 T1 T3 id Ta 
Sa SA 82 83 S1 T3 T1 T2 4 


Observons expérimentalement quelques faits : tous les éléments apparaissent une et une 
seule fois dans chaque ligne et colonne ; dans le premier tableau, l’ordre dans lequel on 
compose des éléments n’importe pas ; dans le second tableau, l’ordre est important, mais 
une chose est préservée : si on veut faire le produit : sotou alors on sait qu’il n’est pas 
nécessaire de “mettre les parenthèses”, c’est-à-dire que (sot)ou=so(tou). 

Nous venons de décortiquer l’archétype d’un groupe ; de manière générale : 


L'ensemble des transformations préservant une figure forme un groupe. 
Pour voir l'intérêt de définitions plus abstraites, essayez de donner une description des 
48 transformations préservant un cube. 
3.2 GROUPES, EXEMPLES 


Définition: Une loi de composition sur un ensemble E est une application de E x E 
vers E. 


Exemples : La plupart des opérations usuelles sont des lois de composition : l’addition 
ou la multiplication sont des lois de composition sur N,Z,Q,R ou C ; la soustraction définit 
une loi de composition sur Z,Q,R ou € (mais pas sur N) ; l’application de F(E,E) x 
F(E,E) vers F(E,E) définie par (f,g) f o g est aussi une loi de composition. 
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Définition: Un groupe est la donnée d’un ensemble G et d’une loi de composition 
(x, y) — x x y telle que : 
(i) (élément neutre) Il existe e dans G tel que pour tout x dans G on a exx = x*xe = x. 
(ii) (associativité) Pour tout x,y,2 dans Gona: (rxy)xz—=xx(yxz). 
(iii) (élément inverse) Pour tout x dans G il existe +’ dans G tel que : xxx” = xxx —e. 
Si de plus pour tout x,y dans G on a : xxy = yxæx, on dit que la loi x est commutative 
et que le groupe (G,*) est commutatif. 


Convention : pour calculer dans un groupe, on omettra souvent le signe * et on écrira 
gh au lieu de g*xh. 


Exemples : 1) L'ensemble des transformations du rectangle (respectivement du carré) 
avec la loi de composition naturelle forme un groupe de cardinal 4 (respectivement 8). Le 
premier groupe est commutatif, le second ne l’est pas. 

2) Les ensembles Z,Q,R et C, munis de l’addition sont des groupes (noter que (N, +) 
ne vérifie pas (iüi)). Les ensembles Q*,R* ou C* munis de la mutiplication sont des groupes 
(noter que (Z \ {0}, x) ne vérifie pas (äi)). Tous ces groupes sont commutatifs. 

3) Soit E un ensemble et soit S(E) l’ensemble des bijections de Æ vers E ; soit o la loi 
de composition naturelle de deux bijections, alors (S(E),0) est un groupe. En particulier 
l’ensemble des bijections de {1,2,3,...,n} vers lui-même, muni de la composition des 
applications, forme un groupe qu’on note $,. C’est un groupe avec n! éléments, on l’appelle 
le groupe des permutations sur n éléments. 


Définition: Un sous-groupe H d’un groupe (G,*) est un sous-ensemble de G tel que la 
loi + restreinte à H x H définisse une loi interne qui donne une loi de groupe sur H. 


Ainsi un sous-groupe est stable pour la loi x (c’est-à-dire que si x,y € H alors x *y € 
H), l'élément neutre e appartient à H et si x € H alors x! € H. Remarquons qu'il est 
inutile de vérifier l’associativité : puisque Vx,y,2 € G, (xy)z = x(y2), il est clair qu’on a 
Vx,y,z € H, (xy)z = x(yz). En fait on peut même raccourcir ces vérifications : 


PROPOSITION: Soit H un sous-ensemble d’un groupe G, c’est un sous-groupe si et 
seulement si il satisfait : 

(jecH 

(ii) x,y € H entraînexy ‘EH. 


Démonstration: Ces conditions sont nécessaires. Réciproquement, supposons les 
propriétés (i) et (ii) vérifiées et montrons qu’alors H est un sous-groupe. Si y € H alors 
ey l=y le H; si x est également dans H alors zy = x(y !) ! € H donc H est bien un 
sous-groupe. [ 


Exemples : 

1) L'ensemble y, des racines complexes de l'équation X” = 1, muni de la multipli- 
cation des nombres complexes forme un sous-groupe de C* : en effet si 2,2 € u\ alors 
(2e == donc 2/2" El. 

2) L'ensemble nZ := {nx | x € Z} muni de l’addition est un sous-groupe de Z. Nous 
verrons au chapitre 5 que ce sont les seuls sous-groupes de Z. 
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3) L'ensemble des rotations préservant le carré s'écrit en reprenant les notations du 
premier paragraphe {id,r1,r2,r3} et est un sous-groupe du groupe des transformations 
préservant le carré. 

4) les inclusions suivantes sont des inclusions de sous-groupes : ZCQCRC C (pour 
la loi d’addition) ; {+1,—1} C Q* C R* C C* (pour la loi de multiplication). L'ensemble 
R* (mais pas R*) est un sous-groupe de R ; le cercle {z € C | }z] = 1} est un sous-groupe 
de C*. 


Définition: Un homomorphisme de groupe est une application f : (G,*) — (H,0) telle 
que : 


Va,y € G, f(x xy) = f(x) o f(y) 


Si de plus f est une bijection, on dit que f est un isomorphisme de groupe et que G et H 
sont isomorphes. 


Exemples : 

1) Considérons l’application x + x”. C’est un homomorphisme de Q* dans Q* (resp. 
R*, resp. C*). Cette application donne un isomorphisme de groupe de R*° dans R* (en 
effet tout réel positif possède une unique racine n-ème positive, voir chapitre 4). 

2) Soit G le groupe des transformations du carré ; soit E := {A, B,C, D} l’ensemble 
des sommets du carré et H l’ensemble des bijections de Æ dans E. Toute transformation 
du carré, préservant les formes, doit envoyer un sommet sur un sommet et donne donc une 
bijection de E sur E. L'application qui à un élément s € G associe sa restriction à Æ est 
un homomorphisme de groupes de G vers H. 

3) Soit G un groupe et g un élément de ce groupe, définissons par récurrence g° := e 
et g*1 := gg" (pour n € N) et enfin g " := (g") !. L'application n + g” de Z vers 
G' est un homomorphisme de groupes, c’est-à-dire que g"*T*? = g"qg". Remarquons que si 
G est fini alors cette application n’est pas injective et il existe donc un plus petit entier 
positif et non nul d tel que gŸ = e. 


Définition: Le plus petit entier d > 1 tel que gŸ = e, s’il existe, s'appelle l’ordre de g, 
s’il n’existe pas on dit que g est d’ordre infini. 


Par exemple, l’élément 2 est d'ordre infini dans Q* alors que —1 est d’ordre 2 dans le 
même groupe. 

Nous avons vu qu'il est important de savoir si une application est injective ou surjec- 
tive. Dans le cas d’homomorphismes de groupes il existe un critère simple qui nécessite les 
définitions suivantes : 


Définition: Le noyau d’un homomorphisme de groupe f : G& — H est l’ensemble 
fl ({en}) = {g € G| f(g) =ex}. On le note Ker(f) (à cause de l'allemand “Kern” ). 


L'importance du noyau vient du théorème suivant : 


THÉORÈME: Un homomorphisme de groupe f : G — H est injectif si et seulement 
si Ker(f) = {ec}. Le noyau de f est toujours un sous-groupe de G!. 


Démonstration: En effet f(x) — f(y) équivaut à f(x)f(y) ! = ex ou encore 
(ay 1) = en, ce qui signifie xy ! € Ker(f). Si Ker(f) = {ec} on voit que f(x) = f(y) 
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entraîne xy ! = e ou encore x = y donc f est injective. Si Ker(f) contient un élément 


g £ ea alors f(g) = f(ec) = ex et f n’est pas injective. 
La deuxième affirmation est facile : si x,y € Ker(f) alors f(xy !) = f(x) f(y 1) = 
f(æ)f(y)}-! = ee! = e donc xy ! € Ker(f). 


Dans le paragraphe suivant nous étudions toutes les notions définies ici, sur l’exemple 
du groupe des permutations sur n éléments. 


3.3 LE GROUPES, 


Un élément s de $, est une permutation de l’ensemble {1,2,3,...,n} et est donc 
défini par la suite s(1),s(2),s(3),...,s(n). On doit aussi se souvenir que si à Æ j alors 
s(i) £ s(j). L'élément neutre sera noté id. On notera en général une permutation par un 
tableau : 


< 2 : 1 2 
Par exemple le groupe $S2 possède 2 éléments : id et t — Ë 1): le groupe S3 
: Fe si cd : . 1 2 3 
possède 6 éléments : l'identité et les cinq permutations : T23 — l'stpiote 


1 2 3 1 2 3 1 2 3 1 2 3 
Ë 1 jrns = (3 9 1 )ser = ( 3 à et pa = (; 1 - Le tableau de 


la loi de groupe de S3 est : 


O id Ti2 T23 T13 P1  P2 
id id Tiz T23 Ti3 Pi  P2 
Ti2 T2 Ôd Pi P2 Ta3 T3 
To3 To3 P2 id Pi Ti3 Ti2 
T13 T13 P1 P2 id T2 T3 
P1 Pi Ti3 Ti2 T23 P2 4 
P2  P2 Toz3 Ti3 Ti2 Ÿd Pi 


On voit en particulier que S3 n’est pas commutatif. 

Sur ces deux exemples on peut facilement définir le signe d’une permutation : (id) — 
+1 et ft) = —1 pour $2 et ensuite e(id) = Ee(p1) = E(p2) = +1 et E(Ti2) = E(T23) = 
E(ñ3) = —1 pour $S3. On vérifie facilement que € est un homomorphisme de groupes (à 
valeurs dans le groupe à deux éléments {+1,—1}). 


Pour étudier les groupes S,, commençons par y définir des éléments particulièrement 
simples. 


Définition: Un m-cycle ou cycle de longueur m dans $S, est une permutation s de 
l’ensemble E := {1,...,n} qui laisse fixes n — m éléments et permute circulairement les 
autres. Plus précisément, il existe un sous-ensemble à m éléments 7 = {i1,...,in} de E 
tel que : sit é I alors s(i) = à mais s(ig) = ix+1 (pour k = 1,...,m — 1) et s(im) = ü. 
L'ensemble Z s’appelle le support du cycle. 


2h 


Une transposition est un cycle de longueur 2. 


Nous noterons $ — (i1,42,...,im) le cycle décrit dans la définition. Une transposition 
ayant pour support {i,j} sera aussi notée 7;; (ce qui est cohérent avec la notation déjà 
utilisée pour les éléments de S2 et S3). 

Exemple : l’élément { € S2 est une transposition, tout comme T12,T13,T23 € S3. Les 


éléments p1,p2 € S3 sont des 3-cycles. Par contre la permutation s — : | ; 
1: 285 À En C6 
; Ze : LES 
n’est pas un cycle. On peut vérifier que la permutation s° — 3 27 5 164 est 
un cycle de longueur 5 et de support {1,3,7,4,5}, c’est-à-dire que s/ — (1,3,7,4,5). 


THÉORÈME: Toute permutation se décompose de manière unique (à l’ordre près) en 
produit de cycles dont les supports sont deux à deux disjoints. 


Démonstration: On utilise une récurrence sur l’entier n, l'affirmation étant claire pour 
n < 3 (puisque toutes les permutations sont alors des cycles). Supposons donc l’énoncé 
démontré pour les permutations de k éléments avec k < n et considérons s € S,. En regar- 
dant la suite 1,s(1),s?(1)... on voit qu’il existe un plus petit entier m > 1 tel que s"*(1) = 1 
(on n'exclut pas que m = 1). Définissons l’ensemble 1 := {1,s(1),52(1)...,s"*-1(1)} et 
le m-cycle r := (1,5(1),s2(1)...,5"-1(1)) ; alors la permutation t :— sr”! laisse fixe les 
éléments de Z et pour à # l'on at(i) = s(i). La restriction de t à J := {1,...,n}\1 est donc 
une permutation des éléments de J que nous notons 8’. Comme card(J) < n on sait (par 
l'hypothèse de récurrence) que 8° = 5° ...s/. avec s! des cycles de J à supports disjoints. 
Définissons s; € S, par 8;(j) = s!(j) si j € Jet (3) = j si j € I ; on voit qu’alors on a 
t— 81...5, et par conséquent s = 51...s,r. Ceci prouve l’existence de la décomposition 
en cycles ; pour l’unicité on observe que le cycle r est uniquement déterminé par s et que 
par hypothèse de récurrence s,,...,s/ (et par conséquent 51,...,s,) sont uniques. O 


Voyons comment on obtient en pratique cette décomposition sur un exemple : Prenons 
k., 22 2. 67 6: À 
3.6. 6h: À 2: 4 
on calcule ses images successives par 9 : on a p(1) = 3, p?(1) = p(3) = 7, p°(1) = p(7) — 
4, p*(1) = p(4) = 5 et p°(1) = p(5) = 1 et on obtient ainsi un premier cycle s’ qui est le 
5-cycle dans l’exemple précédant le théorème. On prend alors un autre élément qui n’est 
pas dans le suppport de s/, par exemple 2 et on recommence : p(2) = 6, p?(2) = p(6) = 2. 
on obtient ainsi la décomposition p — s/726. 


la permutation p — ( . On choisit un premier élément disons 1 et 


Cette décomposition est très utile pour calculer l’ordre d’une permutation (si vous 
n’avez jamais vu la notion de PPCM -— plus petit commun multiple- consultez le chapitre 
5) : 


PROPOSITION: Soit s une permutation qui se décompose en le produit de r cycles 
à supports disjoints de longueurs m1,...,m,, alors l’ordre de la permutation s est égal au 
PPCM(m1,..., Mr). 


Démonstration:  Démontrons d’abord que si la permutation s est un m-cycle, elle a 
pour ordre m : il suffit de le faire pour le cycle s = (1,2,...,m). Or,sii > monas(i) —iet 
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done: 31) =32: 81 maintenant L'<2< m onà 371) = (8 (1) = sm) = 5711) 5 
donc au total s° = id. Par ailleurs si 1 < k < m — 1 alors s*(1) = k+1 £ 1 donc s* Æ id; 
ainsi l’ordre de s est bien m. 

Dans le cas général où s — 51...s, avec s; cycles de longueurs m; à supports disjoints, 


notons N :— PPCM{(m:,...,m,). Observons que, comme les s; commutent, on a 5 — 
s...s* et que, d’après l’unicité de la décomposition en cycles on a s = id si et seulement 
si 8% —...— 8} — id donc si et seulement si l’ordre de s; (c’est-à-dire m;) divise k donc si 


et seulement si N divise k. O 


Exemples : considérons les deux permutations suivantes dans So : 

_f1 2 3 4 5 6 7 8 9 10 ,=/1 23 45 6 7 8 9 10 
F— LA 10 6 8 9301 7 2 Jr" À E 7 86 10 9 
alors les décompositions en cycles de s et { s’écrivent s = (1,4,8,7)(2,10,5,9)(3,6) et 


t = (1,2,3,4,5)(6,7,8)(9,10) et donc ordre(s) = PPCM(4,4,2) = 4 et ordre(t) = 
PPCM(5.3,2) = 30. 


PROPOSITION: Tout cycle peut s’écrire comme produit de transpositions et donc 
toute permutation peut s’écrire comme produit de transpositions. 


Démonstration: Quitte à changer de notation il suffit de montrer que le cycle 
s — (1,2,...,m) s'écrit comme produit de transpositions. Or considérons le produit 
Sora Toue TL OÙ vénitie que sn) = nomma -oma(m- lens 
12723 ... Tii+1(i+1) =... = T2(2) = 1 et quesii < m—1 alors s/(i) = T12723... Tispi(i) = 


T12723 . T1, (à + 1) = i+1 et finalement on a bien s = s’, ce qui achève la preuve. D 


Remarque : la décomposition en produit de transpositions n’est pas du tout unique 
mais la parité du nombre de transposition ne change pas comme on pourra le vérifier à 
l’aide de la notion suivante. 


Définition: Le signe d’une permutation s € S, est défini par le produit : 
s(5) — s(i) 
= I] 0 
1<i<j<n J 
Il est aisé de vérifier que £(s) € {+1,—1} et que le signe d’une transposition est —1 ; 
la principale propriété est la suivante : 
PROPOSITION: Le signe est un homomorphisme de $, vers {+1,—1}. Son noyau 
(l’ensemble des permutations paires que l’on notera À,) est un sous-groupe de cardinal me. 


Démonstration: Pour montrer la première propriété, on calcule le signe du produit de 
deux permutations 5, t : 


ce. mn (mas) (9) - 


1<i<j<n 1<i<j<n ou 
à PA ere 
= ]] 2-0 Ty À 
j—i LL j—i 
1<i<j<n 1<i<j<n 
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Le signe d’une transposition Tr est —1 ; considérons l’application s — sr. C’est une 
application de 4,, vers S, \ À, qui est injective (car s7 = s/7 entraîne s — s/) et surjective 
(car (sr)r = s) donc bijective. Aïnsi n! = card(S,) = card(A,) + card(S, \ A,) = 
2card(A,). D 


Remarque : on voit donc e(s) — +1 si s est le produit d’un nombre pair de trans- 
positions et e(s) — —1 si s est le produit d’un nombre impair de transpositions. Plus 
généralement un cycle de longueur m aura donc un signe (—1)"**!, ce qui donne une 
méthode de calcul du signe d’une permutation connaissant sa décomposition en cycles. 


3.4 STRUCTURE D’ANNEAU ET STRUCTURE DE CORPS. 


Définition: Un anneau est la donnée d’un ensemble À et de deux lois de composition 
+ (addition) et * (Multiplication) telles que : 

(i) (A, +) est un groupe commutatif (dont on note l’élément neutre 0 = 014). 

(ii) La loi * est associative. 

(ii) La loi x possède un élément neutre (qu’on notera 1 = 14) 

(iv) La loi * est distributive par rapport à l’addition : 


Vr,y,2z2E À, xx(y+z)=(xxy)+(xxz) et (y+2)xx = (yxx)+(2xx) 


Si de plus la loi *x est commutative on dit que l’anneau À est commutatif. 


Remarquons que l’on a toujours x x 0 = 0 x x — 0 dans un anneau ; en effet x x 0 — 
x x (0+0) = xx*x0+xx0 et donc (la loi + est une loi de groupe) x x 0 = 0. 


Définition: Un corps est un anneau tel que : 
(v) Tout élément x € À \ {04} possède un inverse. 


Convention : Un anneau (ou un corps) est donc un triplet (A,+,*), l’ensemble A 
s’appelle l’ensemble sous-jacent à l’anneau ; toutefois on parle souvent de l’anneau À en 
sous-entendant les lois + et * quand il est clair dans le contexte de quelles lois il s’agit. 

Exemples : Nous étudierons tout spécialement l’anneau des entiers relatifs (Z, +, x) : 
ce n’est pas un corps car les seuls éléments de Z possédant un inverse pour la multiplication 
sont +1 et —1. Les corps les plus importants que nous étudierons sont le corps des nombres 
rationnels Q, le corps des nombres réels R et le corps des nombres complexes C. Un nombre 
rationnel peut bien sûr s’écrire comme une fraction % avec a € Z et b € Z \ {0} avec la 
règle # — a si ab' — a'b ; l'addition et la multiplication sont définis par # + % — ee, 
Nous verrons aussi que, si K désigne Q, R ou C, l’ensemble des polynômes à coefficients 
dans X, que l’on note X[X], muni de l’addition et de la multiplication naturelles, forme 
un anneau qui possède beaucoup de propriétés communes avec Z. Tous ces anneaux sont 
commutatifs. 


L'ensemble des matrices 2 x 2 à coefficients réels (voir chapitre 7) muni des lois : 
a b a b\ fa+a b+b 
> ‘à c d'J \c+c d+d 


a b a D \  faa +bc ab +bd' 
c d}J' \c dd} \ca'+dc cb + dd! 


forme un anneau qui n’est pas commutatif ; par exemple : 
LP AN ER 2) 00 ds 0 Net 
D ALL AL p EO: À D As LA Of 1 


Règles de calcul dans un anneau : 
(distibutivité généralisée) x D, y = D; Ty 
Attention : dans un anneau, il n’est pas vrai en général que lorsque x € A \ {0} 


TE ke (0 1 RS Re re 
on ait Ty = xZ y = 2; par exemple | |, 1] = (0 1):l0 1 ais 


1 1 2 3 
lo 1)#(6 1) 
Si l’anneau est commutatif : (xy)" = x"y" 
L'expression de la puissance n-ème d’une somme est souvent utile : 


THÉORÈME: (Formule du binôme de Newton) Soient a, b deux éléments d’un anneau 
commutatif et soit n un entier > 1, on a la formule : 


(a+b)" = ÿ_ Crarb? 
p=0 


où CP = 


! . N 212 A 212 
P El est le nombre de parties à p éléments dans un ensemble à n éléments. 


À cause de cette formule, les coefficients C? sont aussi appelés coefficients binômiaur. 
Les premiers exemples de cette formule s’écrivent : 


(a+b)}! =a+b, (a +b)° = a° + 2ab + b°, (a + b}° = a° + 3a°b + 3ab° + b° 
(a +b)? = a+ 4a°b + 6a?b? + 4ab° + b*, (a+ b}° = a° + 5a4b + 10a°b? + 10a?b° + 5ab* + b° 


Démonstration: La démonstration se fait par récurrence sur le nombre n : la formule 
est évidente pour n = 0 ou n = 1, on la suppose donc vraie pour l’entier n, pour tout a, b 
et on cherche à en déduire la formule pour l’entier n + 1. 

On a: (a+b}"TT = (a +b)(a + b)" qui d’après l’hypothèse de récurrence vaut : 


(a +0) D CraroP = NT Chat P + NT CraPpn Pt, 
p=0 p=0 p=0 
cette dernière expression est égale à : 
a EN U(CR + Ch Daho tir 4 pt? 
h=1 
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et, si on se rappelle que C* + C1 = C? +1 celle-ci vaut : 


n+1l 
> (SP à 
h=0 


ce qui est bien la formule de Newton pour l’entier n +1. 


Remarque : L'hypothèse que l’anneau est commutatif ne peut pas être enlevée (dans 
un anneau non commutatif, en général baPb"? n’est égal à a?b"+1-P comme le montre 


l'exemple des matrices À — È 1 et B = Ë 1) puisque (À + B)? = (; à mais 


A? +2AB + B? — EU à 
1 5 
Exercice : Le dessin suivant fournit une illustration de la formule (a+b)? = a?+2ab+b? 
en décomposant un carré de côté a + b en deux carrés de côtés a et b et deux rectangles 
de longueur b et largeur a. 


Donner une illustration de la formule (a +b)*? = a° + 3a?b+3ab? +b° en décomposant 
un cube de coté a + b en deux cubes de côtés a et b, trois parallélipipèdes d’arêtes a, a et 
b et trois parallélipipèdes d’arêtes a, b et b. 


Un peu d’histoire : 

Les notions de groupes et corps ont tiré leur première illustration spectaculaire du 
problème de la “résolution des équations polynomiales”. On connaît depuis le lycée la 
résolution de a + bx + cx? = 0 à l’aide de la fonction racine carrée V ; au XVIème siècle, 
Cardan (également inventeur du système d'’articulation mécanique portant son nom) a 
donné des formules pour résoudre a + bx + cr? + dx* = 0 à l’aide des fonctions V €t 
ÿ ; son élève Ferrari (aucun rapport connu avec Enzo) a ensuite donné des formules pour 
résoudre a+bx+cx? + dx +ex* = 0 à l’aide des fonctions Vs ÿ et 4. Les mathématiciens 
ont longtemps cherché à résoudre ainsi les équations de degré > 5 avant que Abel (1802- 
29) et Galois (1811-32) ne montrent que cela est impossible. Par exemple les solutions 
de x° — x +1 — 0 ne peuvent pas s'exprimer à l’aide de Vi à et 5. Ces propriétés 
des équations de degré 3,4,5, etc sont liées aux propriétés des groupes S3, S1, S5 etc. La 
théorie de Galois (à l’université Paris 7) s'étudie en maîtrise (M1) de mathématiques. 


RSS RSS PSS PSS SSP SALE PE 


SARA DRASS) D 112212 )DD D ? 


Galois Evariste (1811-1832) 
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CHAPITRE 4 LE CORPS DES RÉELS R ET DES COMPLEXES C 


Les nombres “réels” ont été ainsi baptisés car on pensait que ce sont ceux qui per- 
mettaient de décrire les phénomènes physiques. Il est vrai que tout le calcul différentiel, 
et donc toute la mécanique classique repose sur la notion de nombre réel {même si cela 
n’est pas explicite chez Newton et Leibniz). Les nombres réels ont donc été utilisés très 
tôt bien que la démonstration de leurs propriétés et surtout de leur existence (du point 
de vue mathématique!) date du siècle dernier. Nous n’aborderons donc pas cet aspect et 
renvoyons aux traités classiques pour une description de R par les coupures de Dedekind 
ou les classes d'équivalence de suites de Cauchy (Voir par exemple l'ouvrage de Dixmier 
cité en bibliographie). Quant aux nombres complexes, même les mathématiciens ont mis 
longtemps à accepter leur emploi (ils se sont longtemps appelés nombres imaginaires tant 
leur existence était sujette à doute). Néanmoins ils sont assez faciles à construire à partir 
des nombres réels et s'avèrent aussi utiles que les réels, y compris dans les autres sciences 
comme la physique. 


4.1 NOMBRES RÉELS. 


La nécessité de considérer des nombres plus généraux que les nombres rationnels ap- 
paraît déjà avec l'absence de solution à l'équation x? = 2, plus généralement l'existence 
de suite de nombres rationnels (ou de points d’une droite) “ayant l’air de converger” vers 
un point mais ne convergeant pas vers un nombre rationnel (ou un point commensurable) 
conduit à l’introduction des nombres réels que nous définirons ici de manière axiomatique, 
i.e. sans démontrer leur existence. Nous introduisons aussi la notion de limite -déjà 
abordée en terminale- qui est fondamentale dans toute l’analyse : les nombres réels per- 
mettent de nombreux procédés “infinitésimaux” ou de “passage à la limite”. Ceci nous 
permet aussi de traiter précisément et rigoureusement le développement décimal des nom- 
bres réels : il est classique de représenter un nombre réel sous forme de développement 
décimal x = +ao,a1a2a3... an... avec ao € Net a; € {0,1,2,3,4,5,6,7,8,9}. Par exem- 
ple : 


7m = 3,1415926535897932384626433832795028841971693993751058209749445923078 . 


Mais si on cherche à définir un nombre réel comme une telle suite on trouve quelques 
difficultés ; considérons par exemple le “nombre” x :— 0,99999...9..., il est raisonnable de 
penser que 10x = 9,99999...9... et aussi que 10x—x — 9 et donc x = 1 ; la multiplication 
est assez difficile à définir sur les développements décimaur. 


Une notion fondamentale sur les réels est celle d’ordre ; l’ensemble des réels est muni 
d’une addition et d’une multiplication qui en font un corps ; la relation d’ordre pour être 
utile doit être compatible avec ces opérations, plus précisément elle doit vérifier les règles 
suivantes : 

(i) Pour tous x, y, z réels,  <y=r+z<y+z 

(ii) Pour tous x, y réels, pour tout a réel positif x < y = ar < ay 

On peut aussi en déduire : 

(Gi) 0<x<y0<5<i 


(iv) z <y= —-x > —-yet Vx, x? > 0 
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Un corps satisfaisant ces règles est appelé un corps ordonné. 
A ces règles il faut rajouter une propriété qui formalise une intuition : 


Définition: Un corps ordonné est dit archimédien si pour tout x > 0 et y > 0 il existe 
un entier n > 1 tel que nr =x+...+x > y (ici 0 désigne élément neutre). 


Autrement dit, une quantité, aussi petite soit-elle, ajoutée suffisamment de fois à elle- 
même dépasse n'importe quelle quantité donnée. Par exemple le groupe (Z,+) est bien 
sûr archimédien, de même que (Q, +) : les réels forment aussi un corps archimédien : 


CARACTÉRISATION : Le corps (R, +, x, <) contient le corps des rationnels, est un 
corps totalement ordonné archimédien et vérifie la propriété dite des intervalles emboités : 
Soit In — [an,bn] une suite décroissante d’intervalles fermés bornés non vides alors 
MNyen /n est non vide (c’est-à-dire : il existe x ER tel que pour tout n on aitx € I;). 
Un élément de ce corps s’appelle un nombre réel. 


Ainsi, R est caractérisé par le fait d’être un corps (il y a une addition et une multi- 
plication avec les “bonnes” propriétés) d’être totalement ordonné (ce qui le différencie de 
C), archimédien et enfin la dernière propriété le différencie de Q. 

La représentation la plus usuelle des réels est celle des points d’une droite, nous la 
supposons connue. 


La relation d’ordre permet aussi de définir la distance entre deux réels et donc de dire 
si deux réels sont proches : 


Définition: La valeur absolue d’un nombre réel x est max{x,—x} et se note |x]. La 
distance entre deux réels x et y est |x — y|. 


La valeur absolue d’un nombre est donc toujours positive. Rappelons les deux pro- 
priétés bien connues et fondamentales de la valeur absolue : 


THÉORÈME: _ (i) |xy| = |x||yl 
(ii) (inégalité triangulaire) |x + y| < |x| + |yl 


Démonstration:  Laissée en exercice (ou voir les cours au lycée). D 


La deuxième inégalité s’appelle triangulaire (bien qu’il n’y ait pas ici de vrai triangjle : 
les points sont situés sur une droite) ; en effet, si l’on désigne par d(x,y) la distance 
entre deux nombres réels x et y, on peut aussi exprimer l’inégalité (ii) sous la forme 
d(a, c) < d(a,b) + d(b, c) 

Remarque : l'inégalité [x — a] < b équivaut à a — b < x < a + b. Aïnsi les ensembles 
du type {& € R |}x — a] < b} (respectivement {x € R | x — a] < b}) sont des intervalles 
fermés (respectivement ouvert) aux deux extrémités. Inversement un intervalle [a, b] peut 
aussi s’écrire [a,b] = {x ER ||r - ?] < Pc}. 

La notion de distance permet de formaliser l’idée de “tendre vers un point”. Intuitive- 
ment une suite u, tend vers / E R si u, est de plus en plus proche de £ quand n augmente 
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ou encore si u, Se retrouve dans n'importe quel intervalle autour de £, aussi petit soit-il, 
dès que n est assez grand. 


Définition: Une suite u, de nombres réels (ou rationnels) tend vers 0 si elle vérifie : 


Ve > 0, no EN ,n > no = [ul < € 


Une suite u, de nombres réels (ou rationnels) tend vers £ si u, — { tend vers 0. On dit aussi 
que u, converge vers £ ou que £ est la limite de la suite u,, ce que l’on note limu,, = L£. 


Autrement dit : soit n’importe quel (petit) intervalle centré en £, alors tous les termes 
de la suite, sauf un nombre fini sont situés dans l’intervalle. 


Exemples : La suite uy — en a pour limite { — 0 ; montrons cela directement à 
partir de la définition. Soit € > 0, le corps R étant archimédien, il existe un entier n9 plus 
grand que 1/Ee ; soit alors n > no alors 0 < 1/n < 1/no < € donc [u,| < €. Par contre, la 
suite un — (—1)" ne converge pas (si £ est différent de +1 un intervalle suffisamment petit 
centré en Ÿ ne contient aucun terme uw, et si { = +1, un nombre infini de termes éviteront 


un petit intervalle centré en 4). 


THÉORÈME: Soit Un une suite convergente vers une limite {, supposons que pour 
tout n on ait Un > à (respectivement Un > a) alors £ > a. 

Démonstration: Raisonnons par l’absurde et supposons que £ < a. Choisissons un 
intervalle Î contenant { mais pas a (par exemple 1 ={xEeR||x-{| < at} alors les 
éléments de la suite u, sont dans 7 (sauf un nombre fini d’entre eux) mais pour tous les 


éléments x de 7 on a x < a d’où une contradiction. 


Remarque : Si un := eu: on à Un > 0 mais limu, = 0 ; on ne peut donc pas garder 
les inégalités strictes en passant à la limite. 
Exploitons maintenant la propriété des intervalles emboités : 


THÉORÈME: (i) Tout sous-ensemble de R non vide et majoré admet une borne 
supérieure. Tout sous-ensemble de R non vide et minoré admet une borne inférieure. 

(ii) Toute suite croissante et majorée (respectivement décroissante et minorée) est 
convergente. 


(Ce résultat est très important mais on peut omettre la démonstration assez technique) 


Démonstration:  (i) Soit E un ensemble non vide majoré de réels on va construire des 
intervalles emboités 7, = [a,,b,] tels que l’intersection contienne au plus un point (et donc 


exactement un point) qui sera la borne supérieure. Soit e € E et M un majorant de EF, on 


pose Lo := [e, M]. Pour construire 1 on distingue deux cas : si Li est un majorant de E 


M+e 
2 


et on choisit a égal à cet élément et a2 — M. En itérant ce procédé on obtient une 
suite décroissante d’intervalles 7, = [a,,b,] tels que b, soit un majorant de E, tel que a, 


on choisit a; = e et b1 = ;: sinon il existe dans Æ un élément qui est plus grand que 


M<+e 
2 
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soit un élément de E et tel que |b,11 — an+1l < lan-bnl donc |an — bn| < (Me), Montrons 


maintenant qu’il ne peut y avoir qu’un seul point dans l’ensemble $S := [},,.ù /n et que 
c’est la borne supérieure. Tout d’abord soit s,t € S'alors ces deux nombres appartiennent 
aussi /, donc, pour tout n on a [s—t|] < (Me) donc |s—t| —0 et s —t. Par construction 
la suite des a, comme celle des b, converge vers s. Comme tous les b, sont des majorants 
de FE, s est aussi un majorant de Æ ; comme tous les a, sont des éléments de FE, on a que 
s est le plus petit majorant. 

(ii) Considérons E = {u, | n € N}, c’est un ensemble majoré par hypothèse donc il 
admet une borne supérieure £. Montrons que u, converge vers £. Soit € > 0, la définition de 
la borne supérieure entraîne qu’il existe un élément de E, disons u,,, tel que {—Ee <'un, < L; 
mais alors comme u,, est croissante on a pour tout n > n, les inégalités {—e <'uy, < un < L 
et donc |u, — {| < €, ce qui prouve bien que u, tend vers 4. 

( 


Notation : on sait que si x € R alors il existe un unique entier relatif m tel que 
m < x < m +1 on l’appelle la partie entière de x et on le note [x]. Par exemple [7] = 3 et 
[3/2] = —2. 


APPLICATION: DÉVELOPPEMENT DÉCIMAL D'UN NOMBRE RÉEL. 
On appelle bien sûr chiffre un élément de C := {0,1,2,3,4,5,6,7,8,9} (on pourrait 
d’ailleurs faire les mêmes raisonnements dans une autre base que 10). Considérons une 


suite @1,@2,a3,... de chiffres et associons lui la suite de nombres rationnels 
ai a2 An 
Sn = + _ 
10 10 107 


nl 1 .— 
qu'on notera aussi $n :—= Ü,41Q2...a@n. 
1ère étape : la suite s, converge vers un réel x appartenant à l’intervalle [0, 1]. 


Démonstration: En effet la suite 5, est croissante (car 8,11 = 5, +an3110 1 >s,) 
et majorée par 1 : 


En + 1 1 
A 
Le (c++ +) 


enfin comme 0 < s, <lon a bien 0<zx—lims, <1. Ü 


On introduit naturellement la notation : x = 0,a;1a2a3...an... et on appelle cette 
écriture un développement décimal de x. Deux questions se posent naturellement : 

1) Est-ce-que tout nombre réel admet un développement décimal? Autrement dit tout 
nombre x € [0,1] est-il limite d’une suite s,? 

2) Un tel développement est-il unique? 


(en remarquant que x — [x] € [0,1[, on peut se borner à considérer les réels dans 
l'intervalle [0, 1f). 


2ème étape : Tout nombre réel x € [0,1] admet un développement décimal æ = 
0, 414243 ...An.... 
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Démonstration: Fabriquons la suite a := [10x], a2 := [10?x — 10a1] ... an := [10"x — 


107% Ta; — ... — 10a,_1] et ensuite s, := % + 2 +... + <a. Comme 0 < x < 1 on 
a 0 < 10x < 10 donc ay < 10x < a + 1 donc a; < 9 et l’entier a; est bien un chiffre. 
Par ailleurs s1 — 10 <x< 10 + 5 donc 0 < x — 51 < 5. Montrons par récurrence 
que än < 9 (i.e. l’entier a, est un chiffre) et 0 < x —s, < Tr : ce qui prouvera que 
æ = 0,410243...4n... H0<T—-Ss, < _. alors 0 < 101% — 107415, = 107+lx — 
10"*a1 — ...— 10a, < 10 donc 0 < a,+1 < 10 et donc a,+1 est bien un chiffre. Ensuite 
Gn+1 < 107%1%—10%a —...—10a» < an41+1 donc0 <x—-4—... ie mr < 10771; 


ce qu’il fallait démontrer. [l 


3ème étape : Le développement décimal æ = 0, a;a2a3...a,... existe et est unique si 
l’on impose la condition : 
VNEN,Rm>N,ar 49 


Autrement dit on exclut les développements du type 0, aia2 ...an9999...9... (avec a, ZÆ 
9) que l’on remplace par 0, aia2 ...(an + 1)0... 
Par exemple 0,1234567899999...—0,12345679 


Démonstration: Supposons æ = 0,a1a2a3...an...— 0,b1b2b3...b, ... et disons a; — 
b1,...,a7-1 = b;-1 mais a, < b,. On obtient facilement (b,—a;)107" = 0,0...0a;1...— 
0,0...0...b,;11... Le membre de gauche vaut au moins 107" car b, — a, > 1 mais 
dy An 9 9 à 
0,0...0a;11... — Le un = T0 
: “he dont 10" TES MST 


L’inégalité est stricte car il existe des a, < 9 par hypothèse ; on obtient donc une contra- 
diction du type 107" < 107”. 
( 


Remarque : on peut observer que les seuls nombres réels qui admettent “deux” déve- 
loppements sont exactement les nombres rationnels “décimaux” x = 5% 
APPLICATION: RACINE n-IÈME D'UN RÉEL POSITIF 

Soit a € R, et n un entier > 1 alors il existe un unique x € R, tel que x” = a. On 
l’appelle la racine n-ième de a et on le note x — {/a. 


Démonstration: L’unicité est facile car si 0 < x < x’ alors 0 < x" < x". Pour 
montrer l'existence, considérons $S := {y € R} | y” > a} alors S est non vide et minoré 
(par exemple par 0) donc possède une borne inférieure que nous baptisons x. Comme pour 
tout y € S on a y” > a on en déduit x” > a. Si on avait x” < a alors pour e > 0 (mais 
très petit) on en déduirait (x +e)" < a (on donne une démonstration de ce fait ci-dessous) 
et donc x+e & S. Mais alors S ne contient aucun point de l'intervalle [x,x + e] ce qui 
contredit le fait que x est la borne inférieure de $. 

Il nous reste à montrer la “continuité” de la fonction y + y”, c’est-à-dire à montrer 
que si y est très proche de x alors y” est très proche de x”. Nous verrons au chapitre 
13 une méthode générale pour démontrer cela ; donnons néanmoins une démonstration 
directe (où l’on pourra supposer que x > 0). 
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Vérifions par récurrence que pour 0 < h < $ ona(x+h)" < x"+(2"—1)hx"" T'en effet 

(x+h}"ti = (&+h)(&+h}T< < (x+h)(xt + (27 —1)hat 1) = an tlE par (2n + (20 — 1)2) = 

xTL + (212 1)hx" d’où la propriété annoncée. On en déduit que si x < y < x+ 
alors 4° < y" < x" +Ee ; ce qu’il fallait démontrer. [ 


re 1 


4.2 NOMBRES COMPLEXES. 


La nécessité d'étendre le corps des réels se fait sentir si on cherche à résoudre des 
équations comme x? + 1 = 0. Si on ajoute formellement un “nombre” à tel que à? +1 = 0 
alors on peut déjà résoudre les équations de degré 2 ; en effet pour étudier ax? +bx + c = 0 


on introduit À := b? — 4ac et si À > O0 les racines sont VA alors que si À < 0 il 


n'y a pas de racines réelles mais on peut “fabriquer” des racines par la formule SN * 
Ceci suggère d'étudier les “nombres” de la forme x +iy ; il est clair ce que doivent être la 
somme et le produit de tels expressions ; nous prendrons ce guide pour définir les nombres 
complexes. 


Définition: Un nombre complexe s'écrit z = x + iy avec x,y € R ; l’ensemble des 
nombres complexes se note C et est en bijection avec R? =R x R. 


Définition: Soient z = x + iy et 2’ = x’ +iy’ deux nombres complexes. 

On appelle partie réelle (respectivement imaginaire) de z = x + iy le nombre réel x 
(respectivement le nombre y). 

On définit la somme de deux nombres complexes par : 


z+ri=(r+z) +iy+y) 
On définit le produit de deux nombres complexes par : 
22 = (xx — yy') + i(yx' + xy') 


Le conjugué de z est Z := x — iy. Le module de z est [2] := 4/7? + y? = 1/22. 


Remarque : on peut considérer un nombre réel x comme un nombre complexe en 
l’écrivant x = x + i0 ; un nombre réel est égal à son conjugué, la somme et le produit de 
deux nombres réels coïncident avec leur somme et produit comme nombres complexes, le 
module d’un nombre réel est sa valeur absolue. 


THÉORÈME: (i) L'ensemble C muni de la somme et de le multiplication est un corps 
commutatif. L’inverse d’un nombre complexe non nul z = x + iy est donné par 


1 7 T .…  Y 
2 = — à 
22 x2+y a? + y 


(ii) La conjugaison complexe z  Z est un isomorphisme de corps, c’est-à-dire que 1 = 1, 
zx +y=x+yetxy = xy. La conjugaison est involutive, c'est-à-dire que Z = x. 


Démonstration: La vérification des axiomes d’un anneau ne pose aucune dificulté et 
est laissée au lecteur. Vérifions l’existence d’un inverse pour tout nombre complexe non 
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nul. Soit z = x +iy € C*. Comme ||? = 22 = x? + y? € R* on peut définir z/ := z/|2/? 
et clairement 22’ = 1. La deuxième partie de l’énoncé se vérifie par un calcul direct. DO 


Exemples : on vérifiera (en appliquant directement la définition) que : 


(+25) _8+i (558) : (558) ns 


1+4)? = 92i, (1+iv3) = — — 
RS 2+3%) 13 2 2 


Donnons maintenant des représentations géométriques des nombres complexes : 
Représentation dans le plan 


On utilise la bijection € — R? donnée par z - (Re(z),Im(z)) et on représente le 
nombre complexe z par le point M — M(z) d’abscisse Re(z) et d’ordonnée Im(z). Le 
module |z| est la distance entre © et M. 


On peut définir la distance comme pour les nombres réels par d(z, z') := |z— z'|, on 
a alors : 


THÉORÈME: (i)|z2/| = |2|[2/|. 
(ii) (inégalité triangulaire) Pour tous nombres complexes 2, z!' on a |2+2'| <|z|+|2’|. 


Démonstration:  (i) est immédiat car |22/[? = 22/22! = 2227! = |:/?2]2/|?, La preuve 
de (ii) est plus subtile : considérons la fonction de variable réelle P(t) := |2 +12? = 
|212 + 4(22 + 271) + P12/{? ; c'est un polynôme du second degré avec au plus une racine 
(aucune racine si z//z n’est pas réel) donc À := (2/3 + zz/)? — 4|2|?|2/[? < O0 ou encore 


[(z2 + 2271) < 2/z//2’|. Nantis de cette inégalité, développons : 
+2 = a+ 22422 +2 < +221 + 2 = (al + 120? 


Ce qui donne bien l’inégalité cherchée. 


Remarque : Cette fois, l'inégalité (ii) peut se traduire par d(M, M") < d(M, M") + 
d(M"', M") qui est l’inégalité sur un triangle : la somme des longueurs de deux des côtés 
est plus grande que la longueur du troisième côté. 

Ayant la notion de distance, on peut définir quand un point est proche d’un autre en 
particulier la notion de limite (on répète ici la définition par commodité) : 


Définition: Une suite z, de nombres complexes tend vers 0 si elle vérifie : 


Ve > 0, EN,n > n0 = fl <E 


Une suite z, de nombres complexes tend vers L E © si z, — £ tend vers 0. On dit aussi que 
Zn converge vers £ ou que £ est la limite de la suite z,, ce que l’on note limu, = 4. 
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Autrement dit : soit n'importe quel (petit) disque de centre £, alors tous les termes 
de la suite, sauf un nombre fini sont situés dans le disque. 


THÉORÈME: Soit z, une suite de nombres complexes ; limz, — z équivaut à 
lim Re(z,) = Re(z) et limlIm(zh) = Im(2). 


Démonstration: En remplaçant 2, par 2, — z il suffit de prouver que lim 2, = 0 si et 
seulement si lim Re(z,) = 0 et lim/m(z,) = 0. Mais comme |Re(z,)| < [zhl, |Im(zn)| < 
[ënl et [znl < |Re(zn)| + |m(z,)| ceci est clair. D 


Exemple : Si [a| < 1 alors la suite z, := a” converge vers 0 car |z,| converge vers 0. 
Cependant si à = eir V2 Ja suite a” ne converge pas, bien que lim |a”| — 1. 


On admet ici l’existence des fonctions sinus et cosinus telles que si l’angle 0 sur la 
figure ci-dessous est donné en radians (un tour complet vaut 27, un demi-tour 7m, un quart 
de tour 5) alors OA = cos(0) et OB = sin(0). Il y a là une difficulté qui sera levée en 
deuxième année après l’étude de fonctions analytiques. 


On voit donc que tout nombre complexe peut s'exprimer comme : 
z = r(cos(0) + isin(4)) 


avec r =|2lEeER; et 0€ R. Ou encore : si z = a +ib Z 0 avec a, b réels, alors il existe un 
“angle” (i.e. un réel) 0 tel que cos(#) = a/Va? + b? et sin(0) = b/Va? + b?. Le nombre 0 
n’est déterminé qu’à un multiple entier de 2r près, il s'appelle l’argument de z et se note 
Arg(2) (si on veut être tout-à-fait rigoureux, on doit dire un argument). Plus précisément : 


THÉORÈME: _ (i) Supposons r(cos()+isin(@)) = r/(cos(4’)+isin(8’)) avec r, r' € R* 
alors r = r’ et il existe n € Z tel que 0 = 0! + 27n. 

(ii) |z] = |2|, Arg(zz') = Arg(2) + Arg(z') + 2rmn et Arg(z) = —Arg(z) + 27n. 
Démonstration: (i) En prenant les modules on arrive à |r| — |r’| et comme r et r’ sont 
positifs on a bien r — r’. On en tire cos(8) — cos(#’) et sin(9) — sin(0’) ce qui entraîne 
0 —0"+2rn. (ü) La formule donnant le module du conjugué est claire, celle donnant son 
argument découle de celle donnant l’argument d’un produit : Arg(2z) = Arg(z)+Arg(z)+ 
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2kr doit être un multiple de 2r car zZ est réel et positif. La formule donnant l’argument 
d’un produit se déduit des formules classiques cos(y + y’) = cos(y) cos(y’) — sin(y) sin(y/) 
et sin(y + y’) = cos(y)sin(y/) + sin(y) cos(y') ;: en effet si z — r(cos(y) + isin(y)) et 
z' = r’(cos(y") + isin(y’)) alors le produit 22’ vaut : 


22! =rr'{(cos(y) cos(y’) — sin(y) sin(y’)) + i(cos(y) sin(y/) + sin(y) cos(y/))} 
=rr'{cos(y + y") + isin(y +y')} 
d’où Arg(zz') = y+y'+2nr. O 
La meilleure façon de décrire les cordonnées polaires à travers les nombres complexes 
est d'introduire la fonction exponentielle d’une variable complexe : 
Définition: On pose eŸ° :=— cos(@) + isin(0) et plus généralement si z = x + iy : 


e? = ef TU = € cos(y) + ie” sin(y) 


Exemples : 


: 2ri —1+iv3 _ | 
A 


e?TŸ sf 


THÉORÈME: (i) Tout nombre complexe z non nul peut s’écrire z = e pour un 
certain nombre complexe 2’. 

(ii) e* = e* équivaut à Re(z) = Re(z') et Im(z) = Im(z!) + 2m. 

(iii) ete = etet 

Over =E 


Démonstration: (i) provient du fait que tout point du cercle |z] = 1 peut s’écrire 
z = cos(0) +isin(4) pour un 0 E R et du fait que l’exponentielle réelle est surjective de R 
sur R*. 


(ii) est une redite du théorème précédent. 

(ii) On sait que erte ere pour x,x' € R ; il suffit donc de vérifier que eitw+y) = 
eveiv" pour y,y € R. Mais cette dernière égalité équivaut à la formule donnée pour 
l’argument d’un produit de deux nombres complexes. 

(iv) e°— — e?(cos(—y) + isin(—y)) = e*(cos(x) — isin(x)) = et, DO 

On peut utiliser cette représentation pour déterminer les racines n-ième d’un nombre 
complexe : 


THÉORÈME: Soit 20 € C* et n un entier > 1, alors il existe n nombres complexes 
tels que 2° = 20. 
Plus explicitement si 2 = roc"? alors les n racines n-ième sont : 
kr 


z = rer +) avec k € {0,1,...,n—1} 


Démonstration:  Cherchons z sous la forme re"* ; l’équation 2” = 29 équivaut alors à 
re = re ou encore à r" = ro et na = 0 + 2kr (avec k € Z), d’où l'énoncé. D 


En particulier les racines n-ièmes de 1 s’appellent racine de l'unité ; elles forment les 
sommets d’un polygone régulier à n côtés : 
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Racines 5-ième de l’unité : 


Ce dernier théorème est en fait un cas un peu particulier du célèbre théorème de 
D’Alembert-Gauss (il fut énoncé pour la première fois par D’Alembert mais démontré 
rigoureusement plus tard par Gauss) : 


THÉORÈME: (D’Alembert-Gauss). Soit P(X) un polynôme à coefficients complexes, 
si P est non constant, alors il possède une racine, ie. a € C, P(a) = 0. 
Tout polynôme P de degré d > 1 s'écrit : 


P(X) = ap(X — @1)(X — a2)...(X — aa) 


avec ao € C* et @1,0,...,ag € © (non nécessairement distincts). 
0 , , , 


Démonstration: Nous admettrons la première partie. Le fait que la première partie de 
l’énoncé entraîne la seconde est un résultat assez simple d’algèbre que nous démontrerons 
dans le chapitre 6 sur les polynômes. D 


Une autre application classique de la représentation exponentielle est la formule de 
Moivre : 


cos(nx) +isin(nx) = (cos(x) +isin(x))" 


oùxeRetnezZ. 
Démonstration: On sait que e°"* = (ei*)" d’où la formule. 


C’est un exercice classique, en utilisant la formule du binôme de Newton et la for- 
mule cos?(x) + sin?(x) — 1 d’en tirer une expression de cos(næx) et sin(nx)/sin(r) comme 
polynôme en cos(x). Faisons-le pour cos(nx) : 

(cos(x) + isin(x))" = 5%, CÉ(isin(x))*(cos(x))"* donc cos(nr) vaut : 


[3] 
Re{(cos(x) + isin(x))"} = >. C2(—1)"(sin(x))*(cos(x))"?* = 
h=0 


C2h(—1)" (1 — cos?(x)}*(cos(x))"?2À* 


n 
h=0 


Ainsi cos(nx) = P,(cos(x)) avec Pa(X) = ser C2(—1)"(1 — X2)FX7-2h, Par exemple 
Pa(X) = 2X? — 1, Ps(X) = 4X$ —3X et Pa(X) = 8X4 — 8X? +1. 
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Ces formules permettent aussi d'exprimer cos”(x) comme combinaison linéaire de 
cos(nx), cos((n — 2)x),...Par exemple : 


2 1 3 3 
cos?) = POELE conf) = PIB T HOT à cos(æ) = 


cos(4x) + 4 cos(2x) + 3 
8 


4.3 GÉOMÉTRIE ET NOMBRES COMPLEXES 


Nous avons vu que les nombres complexes peuvent être représentés par des points du 
plan ; inversement les nombres complexes permettent une formulation élégante de nom- 
breux problèmes de géométrie du plan. Nous donnons dans cette partie deux exemples de 
ce phénomène. 


4.3.1 Similitudes du plan. 


En géométrie comme en physique, on étudie toujours les transformations préservant les 
distances ou les formes (ou des quantités bien adaptées au problème que l’on veut traiter) : 
on s'intéresse ici aux transformations du plan préservant les formes au sens suivant : 


Définition: Une similitude est une application f du plan vers lui-même telle que, pour 
tout x,y dans le plan, d(f(x), f(y)) = Ad(x, y), où À € RŸ est une constante qui s’appelle 
le rapport de la similitude f. Une similitude de rapport 1 s’appelle une isométrie. 


Exemples : une translation, une rotation (autour d’un point selon un angle donné), 
une symétrie (orthogonale par rapport à une droite), une homothétie sont des similitudes ; 
ce sont des isométries sauf les dernières. 


Les figures suivantes sont semblables deux à deux (il existe une similitude du plan qui 
transforme l’un en l’autre). 


Remarque : l’ensemble des similitudes forme un groupe ; l’application qui à une 
similitude associe son rapport est un homomorphisme de groupe à valeurs dans R* et 
dont le noyau est constitué par le sous-groupe des isométries. 

Les nombres complexes permettent une description simple des similitudes : 


THÉORÈME: L'ensemble des similitudes est décrit par les transformations de € dans 
C données par : 
zh az+b ou 2 az +b 


où a E C*etbe C. Ces transformations sont des isométries si et seulement si |a] = 1. 


Démonstration: Il est immédiat de vérifier que les transformations décrites sont 
des similitudes (de rapport |a]) ;: pour la réciproque, quitte à remplacer f par g(z) — 
(f(z) — f(0))/(f (1) — f(0)), on peut supposer que f(0) = 0 et f(1) = 1. Ecrivons alors les 
deux conditions |f(z) — f(0)| = |z — 0] et |f(z) — f(1)] = |z — 1}, on obtient : |f(2)| = |[z| 
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et |f(2)l? — 2Re f(z) +1 = |? — 2Rez + 1 d'où Ref(z) = Rez et |f(z)| = [2]. On 
obtient ainsi que Vz € C, f(z) = z ou z. Reste à voir que si, disons f(20) = 20, pour un 
nombre complexe non réel, alors pour tout z € C on a f(z) = z. On écrit bien sûr que 
[f(z) — f(zo)l = |z — 2ol donc Re(f(z)20) = Re(zzo). Or l'équation Re (220) = Re (22%) 
entraîne (puisque Im(z0) 0) que Im(z) — 0 donc dans tous les cas f(2) = z. 0 


Exemples. La rotation de centre l’origine et d’angle 0 correspond à la multiplication 
par a = e" : l'application 2 + Z correspond à la symétrie orthogonale par rapport à l'axe 
des abscisses. 


4.3.2 Droites, cercles et transformations homographiques. 


Commençons par exprimer dans le plan complexe l’équation d’une droite et d’un 
cercle. Si z = x + iy (avec x,y € R) on sait que x = EE et y — FE : comme l'équation 
cartésienne d’une droite est de la forme ax + by + c = 0 (avec a,b,c € R et a ou b non 
nul) on en tire, en terme de z, l'équation de la droite : > + at + € ou encore, en 
posant «à — ee, on obtient l’équation az + &z + c. L’équation d’un cercle de centre f et 
de rayon r peut s’écrire |z— B| = r ou encore en élevant au carré : z22+/B2+/82+16|? = r?. 
Réciproquement considérons l'équation azz + Bz + Bz+c=0(oùBeCeta,ceR);si 


a = 0 on retrouve l’équation d’une droite (sauf si B est aussi nul, cas trivial qu’on écarte) : 


A 2 2 
si a 0, on peut diviser par a l’équation et en tirer : 2Z + b; + Êz + 18] = —< + 18] — 
2 
El, On a ainsi montré : 
THÉORÈME: L'ensemble des cercles et droites du plan complexe est décrit par des 
équations du type : 
azz + Bz+6z+c=0 


(où BECeta,cEe R non tous nuls). On obtient ainsi une droite si a = 0 et 6 Æ0, un 
cercle si a Z 0 et ac < |B[? (resp. un point et l’ensemble vide si ac = |B[? ou ac > |B|?). 


Il est clair que les similitudes préservent l’ensemble des droites et des cercles mais il y 
a des transformations beaucoup plus générales qui font cela : 


> $22 £ : : : az+b 
Définition: On appelle fonction homographique toute transformation du type zr 5 


où ad — bc # 0. On appelle fonction anti-homographique toute transformation du type 
2 ÆH où ad — bc £ 0. 


cz+d 
Il faut tout de suite observer que, si c ZÆ 0, la fonction f(z) — Er n’est pas définie 
en z — —4 : on dit que —{ est le pôle de f ; de même la fonction f n’atteint pas la valeur 


+ puisque uztb — + entraînerait bd — ac. Pour ne pas alourdir les énoncés, on sous-entend 


souvent ce fait. Par ailleurs la condition ad — bc 0 est mise pour éviter les fonctions 


ad 
constantes ; en effet si ad—bc = 0 avec disons c # 0 alors b — 2 et donc f(z) = or = ?. 
D'un autre coté considérons g(z) — HE. alors f o g(z) = Ez = 2 (si ad — bc # 0). 


Exemples : 
Les translations f(z) = z + a sont des homographies. 
Les homothéties f(z) — Àz (avec À € R*) sont des homographies. 


A4 


Les rotations f(z) = æz (avec & = e?) sont des homographies. 
La symétrie f(2) = Z est une anti-homographie. 


L’inversion f(2) = 1/2 est une anti-homographie. 


Les quatre premiers exemples sont des similitudes et préservent donc toutes les formes ; 
ce n’est pas le cas de l’inversion, mais elle a tout de même la propriété remarquable de 
transformer une droite D en une droite (si 0 € D) ou un cercle (si 0 & D) et de transformer 
un cercle C en une droite (si 0 € C’) ou un cercle (si 0 # C). Nous allons voir que c’est 
une propriété générale des (anti-)homographies. 


THÉORÈME: Les fonctions homographiques (resp. anti-homographiques) préservent 
l’ensemble des droites et des cercles. Une droite D est transformée en cercle par f, si le 
pôle de f n’est pas situé sur la droite D, ou en droite, si le pôle de f est situé sur la droite 
D. Un cercle C est transformé en cercle par f, si le pôle de f n’est pas situé sur le cercle 
C’, ou en droite, si le pôle de f est situé sur le cercle C. 


Démonstration: Nous vérifions seulement que les (anti-)homographies transforment 
cercles et droites en cercles et droites et admettrons que ce sont les seules transformations 
ayant cette propriété. Une première démonstration est fournit par un calcul formel : par 


exemple l'équation uzz + Bz + Bz + v = 0 se transforme par z - + en 
P q P cz+d 


(ulal? + Bac + Bac + vlcl?)zz + (uab + Bbc + Bad + vcd)z 


+(uab + Bbc + Bad + ved)z + (ulb|? + Bbd + Bbd + v|d|?) = 0. 


Une deuxième démonstration consiste à écrire f(z) = gate comme composée de trans- 


formations simples ; il reste alors à vérifier la propriété pour transformations simples. 


Or, si c'e" 0 on 4 fa) = ee) + £, donc si l’on pose g(z) = cz + d,i(z) = 1/z et 
he) = bad, + alors f = hoïog. Il suffit donc de vérifier la propriété pour à ou encore 


pour l’inversion z + /z, ce que nous avons déjà fait. O 


Remarque : on a omis de préciser dans l’énoncé que si © appartient à une droite ou 


un cercle, ce point n’est jamais dans l’image. ‘ 

Exemple d'application : on veut transformer le demi-plan H := {z € C | Im(z) > 0} 
en le disque D := {2 € C | |] < 1}. La transformation f(2) — _— transforme l’axe des 
imaginaires en l’axe réel et l’axe réel en le cercle de centre © et de rayon 1 et H en D. 


LAPINAISIA SSII NII 


PPPISIIPSSSPIDS LPILL LS TS SN Ê 


D’Alembert Jean (1717-1783) 
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CHAPITRE 5 L'ANNEAU DES ENTIERS Z. 


La théorie des nombres est une des plus belles branches des mathématiques (Zut! 
L'auteur s’est dévoilé comme spécialiste de la théorie des nombres). Traditionnellement 
l’étude des propriétés de divisibilité fait apparaître la notion de nombres premiers : les 
entiers naturels divisibles uniquement par 1 et par eux-mêmes (on exclut 1 par convention) 
dont le début de la liste peut être obtenu par le crible d’Eratosthène : on raye les multiples 
de 2, puis les multiples de 3,5,7 et on obtient : 


2,3,5,7,11,13,17, 19,23, 29, 31, 37, 41, 43, 47,53, 59, 61, 67, 71, 73, 79, 83, 89,97, 101... 


ainsi que l'étude d'équations “diophantiennes comme x? + y? = 2? (triangle pythagori- 
ciens). Longtemps considérée comme une des branches les plus “pures”, la théorie des nom- 
bres a trouvé des applications en informatique, cryptographie (code de cartes bancaires par 
exemple). Un des problèmes fondamentaux est de trouver (ou de prouver qu'il n'existe pas) 
un algorithme “rapide” de factorisation en produit de nombres premiers. L’arithmétique 
dans N est souvent simplifiée par l'introduction des nombres négatifs, i.e. par l’introduction 
de l’anneau Z. 


5.1 ARITHMÉTIQUE 


Nous supposons connu l’ensemble 
Zum RES 0 12... ne ns 


qui est muni d’une loi d’addition et d’une loi de multiplication qui en font un anneau 
commutatif. Il est aussi muni d’une relation d’ordre qui permet de définir la valeur absolue 
d’un entier par la formule [n| := max{n, -n}. 

Divisibilité : on dira que a divise b si b est un multiple de a ou encore si il existe 
c € Z tel que b = ac. Un entier a est inversible si il existe b € Z tel que ab = 1 ; on voit 
facilement que ceci équivaut à a = +1. Aïnsi, si a divise b et b divise a alors a = +b. Un 
nombre est premier si ses seuls diviseurs positifs sont 1 et lui-même (on exclut +1 et -1 
par convention) ; on se restreint parfois aux nombres premiers positifs. 

La propriété la plus fondamentale de l’anneau Z est l’existence de la division eucli- 
dienne qui est utilisée par l'étudiant depuis l’école primaire (au moins pour les nombres 
positifs) : 


THÉORÈME: Soit a,b € 2 avec b Z 0 alors il existe q,r € 2, uniques, tels que : 
a=bq+r0<r< || 


L’entier r s’appelle le reste de la division de a par b, et l’entier qg s’appelle le quotient 
de la division de a par b. 


Démonstration: Supposons d’abord pour simplifier que b est positif. On regarde 
la suite des multiples (positifs et négatifs) de b. On constate qu'il existe q € Z tel que 
gb < a < (q + 1)b (il suffit de prendre pour gq le plus grand entier tel que gb < a) ; posons 
r := à — bq alors il vient 0 < r < b d’où le résultat. Si b est négatif, on procède de même 
avec —a et —b : on obtient —a = q1(—b) + r1 avec 0 < r1 < —b = |b| d’où a = qg1b — r1. Si 
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r1 = 0 on à déjà la division, sinon on écrit a = (q1 + 1)b + (—b — r;1) et on note qu'on a 
bien 0 < —b — r1 < |b|. 

Pour prouver l’unicité, on suppose que a = bq + r = bg +7’ avec 0 < r,r' < |b]. On 
en tire |{b|lq — q'| = |r —r’| < |b] ce qui entraîne |q — q/| — 0 et donc q = g puisr =r. 0 


Remarque : la démonstration donnée est proche mais un peu différente de l’algorithme 
appris à l’école primaire et qui peut être décrit ainsi : on cherche co € {0,1,...,9}et n > 0 
tel que (cp10°)b < a < (co+1)10"b et on remplace a par a; = a—co10"b et on calcule c1 tel 
que (c1107-1)b < ai < (c1 +1)10-1b et à la fin on obtient a = b(co10" +...+c»)+ant1. 


THÉORÈME: Les sous-groupes de Z sont tous de la forme nZ avec n € N. 


Démonstration: Soit G un sous groupe de Z. On sait que 0 € G, si G = {0} alors 
G = 0.Z, sinon il existe n le plus petit élément strictement positif de G. L’ensemble 
des multiples de n est contenu dans G ; inversement, soit g € G, effectuons la division 
euclidienne de g par n, on obtient g = ng +r avec 0 < r < n. On a donc l'égalité 
r = g—nq et donc (comme g et n sont dans @) l’ensemble G contient r mais par choix de 
n ceci entraîne que r = 0 et que g est un multiple de n. On a donc bien G=nZ. D 


Remarque : les sous-groupes de Z sont aussi ses idéaux i.e. les sous-ensembles 7 € Z 
tels que Z soit un sous-groupe et tels que a € Z et b € T entraîne ab € I. 


Définition: Le plus grand commun diviseur (PGCD) de deux nombres a et b est un 
nombre d qui divise a et b et tel que tout diviseur commun de a et b divise d. 


Définition: Le plus petit commun multiple (PPCM) de deux nombres a et b est un 
nombre m qui est un multiple a et b et tel que tout multiple commun de a et b est multiple 
de m. 


Remarque : il n’est pas évident que le PGCD ou le PPCM existe mais ceci est garanti 
par la proposition suivante. Quand à l’unicité, la remarque faite sur les éléments inversibles 
montre que le PGCD (ou le PPCM) est unique au signe près. On choisit bien sûr le signe 
plus. 


Remarque : si a,b € Z on peut définir le sous-ensemble suivant de Z : 
aZ + bZ := {au + bv | u,v € Z} 
dont on vérifie aisément que c’est un sous-groupe. De même aZ N bZ est un sous-groupe. 


PROPOSITION: Soit a et b deux entiers non nuls alors il existe deux entiers d et m 
tels que aZ + bZ = dZ et aZ NN bZ = mZ. De plus l’entier d est un PGCD da etb,etm 
est un PPCM de a et b. Enfin on a l'égalité ab = +md. 


Démonstration: Soit d € Z tel que aZ + bZ = dZ, montrons que d est un PGCD de a 
et b. Tout d’abord a = a.1+b.0 est un multiple de d donc d divise a (et aussi b par le même 
raisonnement ; on peut aussi écrire d = au + bv pour certains entiers u,v, par conséquent 
tout entier e diviseur commun de a et b divise au, bv et donc leur somme c’est-à-dire d. 
Soit m € Z tel que aZ N bZ = mZ, montrons que d est un PPCM de a et b. Tout 
d’abord m € aZ donc m est un multiple de a (et aussi de b par le même raisonnement) : 
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si m'est un multiple de a et b alors m’ € aZ et m’ € bZ et donc m’ € mZ c’est-à-dire que 
m/ est un multiple de m. 

On sait donc que a = a/d et b = b'd donc r := a/b'd est un multiple de a et b et est 
donc divisible par m ; donc md divise rd = ab. Par ailleurs, d’après la première partie du 
théorème, il existe u,v € Z tels que d = au + bu donc md = aum + bum ; mais ab divise 
am et bm donc md et on peut conclure que md = +ab. 


Si PGCD(a,b) = 1 on dit que a et b sont premiers entre eux. Le résultat précédent 
nous permet de caractériser ces nombres : 


THÉORÈME:  (Bézout) Soit d := PGCD(a,b) alors il existe deux entiers u et vw tels 
que 
au + bv = d 


En particulier deux entiers a et b sont premiers entre eux si et seulement si il existe u, v 
entiers tels que au + bv = 1. 


Démonstration: La première partie de l’énoncé est une conséquence directe de la 
proposition précédente. Pour la deuxième partie, notons que si PGCD(a,b) = 1 alors il 
existe u,v € Z tels que au + bu = 1 ; inversement si de tels u, v existent, alors un diviseur 
d de a et b diviserait au + bu et donc 1 ce qui donne bien que a et b sont premiers entre 
eux. 


Une des méthodes les plus rapides pour calculer le PGCD (et par conséquent le PPCM) 
est la suivante : 


THÉORÈME: (Algorithme d’Euclide) 

L’algorithme suivant fournit un calcul du PGCD de a et b : 
a—=bq\+r1 (division de a par b) 

b—rig2 +r2 (division de b par r1) 

T1 = T2q3 +73 (division de r; par r2) 

Tn-1 = Tnn+1 +Tn+1 (division de r,-_1 par rh) 

Jusqu'à ce que rh11 = 0 et alors PGCD(a, b) =r» 


Démonstration: Elle consiste à vérifier que 
PGCD(a,b) = PGCD(b, r1) = PGCD(r1,r2) =... = PGCD(rh-_1,7n) = PGCD(ry, Tn+1) 


car clairement PGCD(r,,Tn+1) = Tn. Il suffit donc de montrer que pour à.,b et q entier 
on à PGCD(a,b) = PGCD(a — bg, b) ; ceci résulte du fait que d divise a et b équivaut à d 
divise bet a—bq. Ü 


Remarque : si on le souhaite, une variante de cet algorithme permet de trouver u, v 
entiers tels que au + bu — PGCD(a,b). En effet il suffit d'écrire PGCD(a,b) = rh = 
Tn-2 — Qnln-1 Tn-1 = Tn-3 — An-1Tn-2 etc pour en tirer r, comme combinaison de 
Tn-2,Tn-3 et ainsi de suite jusqu’à l’exprimer comme combinaison de a et b (ceci fournit 
d’ailleurs une autre démonstration du théorème de Bézout). 
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Faisons ce calcul sur un exemple ; 
1932—6.301+126 
301—2.126+49 
126—2.49+28 
49=1.28+21 
28=—1.21+7 
21=3.7+0 (FIN du calcul du PGCD) 
et 
7=28-21—2.28-49—2.126-5.49=—-5.301+12.126—12.1932-77.301 (FIN du calcul) 
Résultat : PGCD(1932, 301) — 7 — 12.1932 — 77.301 


THÉORÈME:  (i) (Euclide) Soit p un nombre premier, si p divise ab alors p divise a 
ou b. 
(ii) (Gauss) Si PGCD(a, b) = 1 et a divise bc alors a divise c. 


Démonstration: (i) Supposons que p ne divise pas a alors 1 = PGCD(a,p) = pu + av 
donc b = pbu + abv donc p divisant pbu et abv divise b. 
(ii) On à de même 1 = PGCD(a, b) = au + bu donc c = acu + bev donc a divise c. D 


THÉORÈME: (Unicité de la décomposition en facteurs premiers) Soit n un entier 
distinct de 0,1, —1 alors il existe € — +1, il existe des nombres premiers p1,...,p, et des 
entiers Mm1,...,Mr > 1 tels que 

REED sp t 


de plus cette décomposition est unique à l’ordre près. 


Exemples : 6440 — 2%.5.7.23, 1932 — 22.3.7.23, 301 — 7.43 Question : Avez-vous déjà 
factorisé votre numéro de téléphone? Celui de la police est un nombre premier alors que 
celui des pompiers se décompose en 2.3°. 


Démonstration: L'existence se prouve par récurrence sur n : si n est premier alors, 
on est content, sinon on a n = ab avec a < n et b < n donc a et b, d’après l’hypothèse de 
récurrence se décomposent en produit de nombres premiers et donc n aussi. 

L’unicité découle de l’application répétée du théorème d’Euclide (ou de Gauss). 


Remarques : si l’on connait la décomposition en facteurs premiers de deux nombres 
on peut facilement en déduire leur PGCD, mais ce n’est pas en général une méthode 
efficace de calcul. Par exemple on retrouve PGCD(1932,301) — 7 et on peut calculer 
PGCD(6440, 1932) — 23 et PGCD(6440, 301) — 1. 


APPLICATION: Soit ne N qui ne soit pas le carré d’un entier naturel, alors n n’est 
pas non plus le carré d’un nombre rationnel ; en d’autres termes le nombre {/n n’est pas 
un nombre rationnel. 


Démonstration: Ecrivons n = pf''...p}" ; comme n n’est pas un carré, l’un des 
nombres premiers p; apparaît dans la décomposition avec un exposant m; impair. Si l’on 
pouvait écrire /n = a/b avec a, b € N on aurait b? = na? ; appelons m (resp. n) l’exposant 
de p; dans la décomposition de a (resp. de b), alors l’unicité de la décomposition entraîne 
que 2n = 2m + m,; ce qui est absurde puisque m,; est impair. D 
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APPLICATION: Il existe une infinité de nombres premiers : 


Démonstration: Soient p1,...,p- un ensemble fini de nombres premiers, montrons 
qu’il existe un nombre premier distinct de ceux-ci, ce qui achèvera la démonstration. Pour 
cela considérons N := (p1...p,) + 1 et q un facteur premier de N (il en existe) ; comme 
les p; ne divisent pas N on doit avoir q distinct des p;. D 


Cet énoncé peut être considérablement affiné en quantifiant “combien” il y a de nom- 
bres premiers. Appelons m(x) le nombre de nombres premiers < x ; par exemple r(2) = 1, 
n(3) = 2, r(10) = 4 et x(100) = 25. I y a un siècle Hadamard et De La Vallée-Poussin 
ont réussi à montrer que (x) valait à peu près x/log(x) (présisément r(x) log(x)/x tend 
vers 1 quand x tend vers l'infini). On peut interpréter ceci en disant que la probabilité pour 
qu’un nombre < x soit premier est environ 1/log(x) ; par exemple 100/ log 100 — 21,71... 
et n(100) log(100)/100 — 1,15... est déjà proche de 1 ; en poussant un peu plus loin le 
calcul on obtient r(1000000) log(1000000)/1000000 = 1,084...... 


5.2 CONGRUENCES 


L'étudiant connait depuis l’école primaire les raisonnements de parité, la “preuve” par 
neuf et (peut-être) la “preuve” par onze du résultat d’une multiplication. La théorie des 
congruences est une généralisation de ce type de raisonnement. 


5.2.1 Propriétés des congruences 


Soit n un entier (strictement) positif, rappelons la définition de la relation de congru- 
ence modulo n 


Définition: Deux nombres entiers a et b sont congruents modulo n si leur différence 
est divisible par n. On note cela a = bmodn. 

C’est une relation d'équivalence : elle est réflexive, symétrique, transitive (voir chapitre 
2). Enonçons quelques unes de ses propriétés : 


PROPOSITION: 1) Supposons que a = bmodn et c = dmodn, alors a + c = 
b + dmodn et ac = bdmodn et sir > 0, on a a” = b" modn. 

2) Si PGCD(c,n) = 1 alors il existe c’ € Z tel que cc’ = 1modn et donc la congruence 
ac = bcmodn entraîne a = bmodn. 

3) a = bmod mn entraîne a = bmodn. 


Démonstration: 1) L'hypothèse se traduit par a = b + kn et c = d + jn donc 
a+c—=b+d+(j+k)n et ac = bd+(kd+bj+kjn}n. L'égalité a” = bd" + {n s'obtient par 
récurrence sur Tr. 

2) Sicet n sont premiers entre eux il existe u,v € Z tels que cu + nu = 1 et par 
conséquent cu = 1modn. Si maintenant ac = bcmodn, en multipliant par uw on obtient 
bien a = bmod n. 

3) C’est immédiat. D 


Remarque : sans l’hypothèse PGCD(c, n) = 1 la conclusion de l’énoncé 2) peut être 
fausse car par exemple 2.4 = 2.1 mod6 mais 4 £ 1 mod6. 

Exemples de calculs : 1995 = 5 mod 10 donc 19954 = 54 mod 10 mais 5? = 5 mod 10 
donc 19954 = 5 mod 10. De même on peut calculer 19911%%1 = 1 mod 10. 
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APPLICATION: Preuves par 9 et 11. 
L'écriture d’un nombre M en base décimale M = c;cy_1...0c1C0 signifie : 


Meet he A0 ES, Perl 


et par conséquent M = c, + Cn_1...+ 01 + co mod9 (puisque 10 = 1 mod 9) et également 
M = co—ci+c2...+(—-1)" lc 1 +(—1)"c, mod 11 (puisque 10 = —1 mod 11). Supposons 
qu’on veuille vérifier le résultat d’une multiplication M x N — L?, on calcule les restes 
{, m, n de la division par 9 (idem avec 11) de L, M, N et on vérifie si mn = {mod9. 
Cela ne donne qu’une vérification et non une preuve, mais on ne fait pas souvent 9 erreurs 
de retenue...Le choix de 9 ou 11 provient du fait qu’on a une astuce simple permettant 
de calculer le reste modulo 9 ou 11 sans faire de division euclidienne. Exemple : M — 
1111114444 et N = 1234567 alors M = 22 = 4mod9 et M = O0mod11, N = 28 = 1mod9 
et N = 4mod11 donc MN = 4mod9 et MN =Omod11. 


THÉORÈME: (théorème des restes chinois) 
Supposons que PGCD(m,n) = 1 alors le système de congruence : 


x =amodm 
x = bmodn 


possède une solution x, € Z et toutes les autres sont de la forme #0 + mnk avec k € Z. 


Démonstration: D’après le théorème de Bézout, il existe deux entiers u,v (dont on 
possède un algorithme de calcul) tels que um + un = 1, posons donc +9 := a + (b — a)um 
alors xo = b — (b — a)vn et c’est donc bien une solution du système de congruence. Soit x 
une autre solution, on à donc æ — 70 = Ümodm et x — x0 = Ümodn donc (comme m et n 
sont premiers entre eux) &æ — xo = Ümodmn. D 


Exemple : soit à résoudre 


x = 5 mod 276 

x = 2 mod 43 
On a vu que 276(—1932/7) et 43(—301/7) sont premiers entre eux et que 1 = 12.276—77.43 : 
on obtient donc une solution x0 = 5 + (2 — 5)12.276 — —9936 et les autres solution sont 


donnés par x — —9936 + 11868k ; la plus petite solution positive est 1932. 


THÉORÈME: (‘Petit” théorème de Fermat) 
Soit p un nombre premier, alors pour tout entier a € Z on a la congruence a? = 
a mod p ; si de plus p ne divise pas a alors a?! = 1 mod p. 


Démonstration: Commençons par établir que (x + y}? = x? + y modp. En effet, 
d’après la formule du binôme de Newton, cette formule est surement vraie si tous les où 
pour 1 < k < p — 1 sont divisibles par p. Mais CÉKk!(p — k)! = pl et p ne divise ni k! ni 
p — k (c’est là qu’on utilise que p est premier) car sinon, d’après le théorème d’Euclide, il 
diviserait un des facteurs c’est à dire un nombre < p ; par conséquent en appliquant encore 
une fois Euclide on obtient que p divise (es . On peut maintenant en déduire : 


a —a=(a—-1} —-(a—-1)=...=1? -1=0modp 
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Si de plus p ne divise pas a alors a possède un inverse modulo p et donc a?! = 1 mod p. 
[] 
COROLLAIRE: Si a =b £0modp et si c = dmod(p — 1) alors a° = b{ mod p. 
Démonstration: On sait déjà que a° = b° mod p et par ailleurs c = d + k(p — 1) donc 
be = b2 (bP-1)" = bémodp. CI 

Exemple: 11234578 = 99 = 392 = -]mod1l, 

5.2.2 L’anneau Z/nZ 


Notation : on désignera par à le reste de la division de a par n (c’est donc par 
convention un entier dans {0,1,2,...,n—1}. 


Définition: On appelle Z/nZ l’ensemble {0,1,2,...,n — 1} muni des lois d’addition et 
de multiplication suivantes : (a,b) - (a +b) et (a,b) + ab. 


PROPOSITION: L'ensemble Z/nZ, muni de ses lois d’addition et de multiplication 
est un anneau commutatif. 


Démonstration: Découle immédiatement des propriétés de Z et des propriétés des 
congruences. [ 


On peut se demander s’il s’agit d’un corps, la réponse est la suivante : 
THÉORÈME: L'anneau Z /n2Z est un corps si et seulement si n est premier. 


Démonstration: Sin n’est pas premier, alors n = ab avec a,b Æ +1 et donc ni à, ni b 
n’est un multiple de n. Mais dans Z/nZ on a donc à Z 0 et b Z£ 0 mais ab = ab = ñ — 0 
donc Z/nZ ne peut pas être un corps. Inversement si n est premier, montrons que tout 
élément a € Z/n2Z \ {0} possède un inverse : a et n sont premier entre eux donc il existe 
u,v tels que au + un = 1 et donc au = 1modn et donc (dans Z/nZ) onaau=1. D 


On peut traduire le théorème des restes chinois aïnsi : 

Considérons l'application p : Z/mnZ — Z/m2Z x Z/n2Z qui a un élément a € Z/nmZ 
associe son reste modulo m et son reste modulo n ; les propriétés des congruences perme- 
ttent de vérifier que c’est un morphisme d’anneaux : p(a + b) — pa) + p(b) et p(ab) — 
p{a)p(b), le théorème des restes chinois dit que si PGCD(m,n) = 1 alors p est une bijection 
(un isomorphisme). 


Le calcul sur ordinateur s'effectue en fait modulo 2N (avec N dépendant de la machine, 
du logiciel, etc). Par exemple, Turbo-Pascal recquiert, pour le type entier, des nombres 
compris entre -32768 et 32767 ; cela signifie qu'il travaille modulo 21 [note : 216 — 1 — 
65535 — 32768 + 32767. 

Enfin indiquons que la cryptographie (cartes bancaires, transaction par internet, etc.) 
fait un usage massif, à travers le système RSA notamment, des groupes finis des éléments 
inversibles de Z/nZ et des (grands) nombres premiers. les espaces vectoriels sur le corps 
Z/pZ sont eux à la base des codes correcteurs d’erreurs (compact disque, transmission 
d'image, etc). 
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CHAPITRE 6 L’ANNEAU DES POLYNÔMES 


Vous avez étudié depuis la seconde jusqu’à la terminale les fonctions de variable réeelle 
de la forme x + ant" +... + aix + ao et appris à résoudre les équations du premier et 
du second degré. Il est commode pour approfondir cette étude de considérer les expressions 
formelles du type anx" + ... + aix + ao et de travailler directement sur elles. C’est ce 
point de vue qu’on adopte ici : un polynôme est défini comme la suite de ses coefficients ; 
cela permet notamment de développer l’analogie entre les propriétés de divisibilité dans 
l’anneau des polynômes et dans l’anneau Z. Bien entendu la notation P = (ao,...,an), 
même si elle présente l’avantage d'’insister sur le rôle des coefficients, est impraticable et 
on utilisera la notation usuelle P = ao +...+a,X”", celle de tout le monde, même des 
mathématiciens. 


6.1 POLYNÔMES 
K désignera ici un sous-corps de € que l’on pourra prendre égal à R ou € pour simplifier. 


Définition: Un polynôme à coefficient dans K est une suite d’éléments de K, disons 
P = (ao, a1,...,an,...) telle qu’il existe no avec Vn > no, an — 0. Les a; s’appellent les 
coefficients du polynôme P. 

Un polynôme du type (ao,0,0,...) s'appelle un polynôme constant. Le polynôme 
(0,0,...) s'appelle le polynôme nul. 

Le degré d’un polynôme non nul P = (ao, &1,...,@n,...) est l’entier 


deg(P) := max{n € N | a, #0} 


Il nous faut bien sûr définir l’addition et la multiplication : 


Définition: Soit P — (ao,a1,...,an,...) et Q = (bo,b1,...,bn,...) deux polynômes, 
alors leur somme et leur produit sont définis par : P+Q := (ao+bo,a1+b1,...,a@n+bn,...) 
LPO (Gen tavec ce D ab 


THÉORÈME: L'ensemble des polynômes, muni de l’addition et de la multiplication 
est un anneau commutatif ; l'élément neutre pour l’addition est le polynôme nul, l’élément 
neutre pour la multiplication est le polynôme constant 1 := (1,0,0,...). 

On a les relations (lorsque ni P, ni Q ni P+Q ne sont nuls) : 


deg(P + Q) < max{deg(P),deg(Q)} et deg(PQ) = deg(P) + deg(Q) 


Démonstration: Il est immédiat de vérifier que l’addition définit une loi de groupe. Le 
polynôme constant dont le premier coefficient est 1 est bien l’élément neutre car si b5 = 1 
et b; = 0 pour à > 1 on a bien ne aibn_; = An. Vérifier l’associativité est un exercice 
sur la notation “Sigma” que l’on laisse au lecteur. 

Démontrons maintenant les formules sur les degrés : si deg(P) — d (resp. deg(Q) — e) 
et pa (resp. qe) est le dernier coefficient non nul de P (resp. de Q) on voit facilement que 
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pi + qi = 0 dès que à > max(d,e) d’où la première inégalité. Remarquons que si d > e 
le dernier coefficient non nul de P + Q est pa et donc dans ce cas on a deg(P + Q) — 
max{deg(P),deg(Q)} (idem si d < e) alors que si d — e tous les coefficients de P + Q 
d'indice strictement supérieur à d sont nuls et le coefficient d'indice d vaut p4 + qe et donc 
peut fort bien être nul. Si n > d+e alors De Pidn—i = 0 Car chacun des termes est nul 
(ou bien à > dou bien n—i>e); par ailleurs le (d+e)-ème coefficient de PQ est page Æ 0. 
De ces deux remarques on tire que deg(PQ) =d+e. E 


Voyons maintenant comment justifier et revenir à une notation plus usuelle : intro- 
duisons le polynôme X = (0,1,0,0...) ; on voit facilement que X? = X.X = (0,0,1,0,...) 
et plus généralement que X° = (0,0,...,0,1,0,...) (où le 1 est le coefficient d'indice n). 
On en déduit une écriture plus commode (qui est celle que l’on utilisera dans toute la 
suite!) : 

(aps Gus @nse) = dl FaX +dX?+..+a,X" 


Ceci justifie la 
Notation : l’ensemble des polynômes à coefficients dans K se note K[X]. On dit que X 
est une indéterminée. 


Remarque : nous distinguons donc le polynôme ao + a X +a2X?+...+a,X" de la 
fonction x + ag + 417 + a2t° +... + ant”. 


La propriété fondamentale de l’anneau des polynômes est, tout comme pour Z, l’exis- 
tence d’une division euclidienne : 


THÉORÈME: Soit À e K|X] et Be K[X]\ {0}, il existe Q,R € K[X|, uniques tels 
que : 
A=BQ+R et R=0 ou deg(R) < deg(B) 


Démonstration:  (unicité) Supposons À = BQ +R = BQ' + R' ; alors B(Q — Q') — 
R'—R. Si R' était distinct de R alors deg(B) < deg(B(Q — Q')) = deg(R' — R) < deg(B) 
amènerait une contradiction donc R = R’ et par conséquent Q = Q. 

(existence) La preuve se fait par récurrence sur n :— deg(A). Observons que si 
deg(A) < deg(B) alors À = 0.B + À fournit une division euclidienne. Supposons donc 
démontrée l’existence de la division euclidienne pour les polynômes de degré < n — 1 et 
établissons son existence pour À de degré n. On peut supposer n > deg(B) — m sinon on 
est dans un cas déjà traité ; écrivons À = a, X" +...et B = b,,X" +... et considérons 
A :=A- 2X" 8 ; si A; — 0 la démonstration est terminée et sinon, on voit aisément 
que deg(A1) < n — 1 car le coefficient de degré n s’annule (c’est fait pour!) donc d’après 
l'hypothèse de récurrence on sait que A1 = BQ1 + R1 avec deg(R1) < deg(B) d’où l’on 


tire A=B (Qr + gexn-m) + R1 ce qui achève la démonstration de l’existence. D 


Exemple : La démonstration fournit d’ailleurs un algorithme pour calculer Q et R ; 
illustrons cela avec À = 2X°+3X%+X?2-X+5et B=X?+X -—1: 0on peut présenter 
les calculs comme ceux de la division euclidienne usuelle (dans 2) : 
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2XS+3XŸ+X?-X +5 X2+X—-1 


— PATENT OX DXSINE LENS 
OX MEXS NN are 
e LOXE DXSLONZ 
LÉ RER CEE 
e ETS Cire 
—8X?+6X +5 
e —8X2-8X +8 
AX-=53 


ainsi 2X°+3X8+X2-X+5—(X2+X —1)(2X$ —-2X2+7X —8) + (14X — 3). 


L'existence de la division euclidienne permet de développer les propriétés de divis- 
ibilité : PGCD,PPCM, théorème de Bézout, algorithme d’Euclide, théorème de Gauss, 
décomposition en produit de facteurs, de manière entièrement analogue à Z. Nous donnons 
donc seulement les énoncés et renvoyons au chapitre précédent pour les démonstrations en 
signalant seulement les endroits où le vocabulaire introduit des différences. Les polynômes 
inversibles sont les constantes non nulles : en effet il est clair que ces polynômes sont 
inversibles et réciproquement si PQ = 1 on a deg(P) + deg(Q) = 0 et on conclut que P 
est constant. L’analogue des nombres premiers est donné par les polynômes irréductibles, 
i.e. par les polynômes P, non constants, qui ne peuvent s’écrire P = QR avec Q, R deux 
polynômes non constants. Les polynômes inversibles sont les constantes non nulles. 


Définition: Le plus grand diviseur commun ou PGCD de deux polynômes À et B € 
KTX! est un polynôme D qui divise À et B et tel que tout polynôme divisant À et B divise 
nécessairement D. Le plus petit commun multiple est un polynôme M multiple de À et B 
et tel que tout polynôme multiple de À et B soit divisible par M. 


THÉORÈME: Soient À, B deux polynômes, l’un d’entre eux non nul (au moins), le 
PGOCD de À et B existe et, si l’on impose qu'il soit unitaire, il est unique. De même le 
PPCM existe et l’on a PPCM(A, B) PGCD(A, B) = AB. 
L'’algorithme (d’Euclide) suivant fournit un calcul du PGCD : 
A=BQ;+kR1 (division de À par B) 
B=R;Q2+R2 (division de B par R1) 
R1 = R2Q3+R3 (division de À; par Ro) 
Rn-1 = RnQn+1 + Rn+1 (division de R;-_1 par R;) 
Jusqu'à ce que R,11 = 0 et alors PGCD(A,B)=R, 


Démonstration: La démonstration est identique au cas arithmétique : on doit seule- 
ment observer que deg(R;:1) < deg(R;) pour s'assurer que l’algorithme converge. OC 


Exemple de calcul : prenons À := X6+X5+X4+X2+X+1et B=X5+X4+ 
X3+ X2+ X +1 alors 
A=BQ;+R (avec Q: = X et R1 = 1-— X*) 
B = RQ: + Ro (avec Q2 = —X?—-X —-1et R2 = 2X°? +2X +2) 
R: —= R2Q3 + R3 (avec Q3 —= _ et R3 —= 0) 
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donc R2 = 2(X?+X +1) est le PGCD. Si l’on impose qu'ils soient unitaires PGCD(A, B) = 
X?2+X+1et PPCM(A,B) = (X4+1)B = X° + X8 + XT7 + X6+2XS +2X4 + X4 + 
X$+X?+X +1. 


THÉORÈME: (Bézout) Soit A,B € KIÏX] alors il existe U,V € KIÏX] tels que 
AU + BV = PGCD(A,B). De plus l'algorithme d’Euclide fournit également un calcul 
de U et V. 


Remarque : Les polynômes U et V ne sont pas uniques (en effet U’ = U + QB et 
V' = V — QA font aussi l’affaire) mais on peut imposer (si À et B non constants) que 
deg(U) < deg(B) — 1 et deg(V) < deg(A) — 1. 


Démonstration: On “copie” la démonstration faite pour Z : 

Considérons l’ensemble I := {AP + BQ | P,Q € K[X]} ; c’est un idéal de K[X] : la 
somme de deux éléments de Z est dans I et le produit par un polynôme quelconque d’un 
élément de à est encore dans J ; l’existence de la division euclidienne entraîne, comme dans 
Z, que tout idéal est engendré par un élément, c’est-à-dire que ? = DKIX]={DP|PE 
KI[X]}. Par définition de J il existe U,V € KT[X] tels que D = AU + BV. Voyons que 
D = PGCD(4, B) : tout d’abord À € 1 donc À est un multiple de D, idem pour B donc 
D divise À et B ; si maintenant C divise À et B alors C divise D = AU + BV donc D est 
bien le PGCD. D 


Exemple : reprenons le cas précédent À := X6+ XS+ X4+X?2+X+1et B — 
XS+X4+X$ + X2+ X + 1 alors en remontant les étapes de l'algorithme d’Eclide on 
obtient : Ro = B — RQ» = B — (A = BQ:)Q:2 d’où PGCD(A,B) — X? + X +1 = 
(—-30Q2)A + 5(1 + Q:1Q2)B. 


Définition: Un polynôme P € K[X] est dit irréductible s’il n’est pas constant et si les 
seules factorisations P = QR (avec Q,R € K[X1) s’obtiennent avec P ou Q constant. 


Remarques : i) La notion de polynôme irréductible correspond à celle de nombre 
premier dans Z. 

ii) Les polynômes de degré 1 sont irréductibles car X — a — QR entraîne Q ou 
R constant pour des raisons de degré. Néanmoins il y a beaucoup d’autres polynômes 
irréductibles en général ; par exemple X? + 1 est irréductible dans R[X], X°? — X + 1 est 
irréductible dans Q[X] 

ii) Il est indispensable de préciser le corps K car par exemple X? + 1 n’est pas 
irréductible dans C[X] et X° — X +1 n’est pas irréductible dans R[X] (ils ont chacun au 
moins une racine). 


THÉORÈME: 
(i) (Euclide) Soit P irréductible dans K]X] et divisant QR alors P divise Q ou R. 
(ii) (Gauss) Si PGCD(P,Q) = 1 et P divise QR alors P divise R. 


Démonstration: La démonstration est entièrement analogue à celle faite dans Z. D 


THÉORÈME: Soit P € K[X] un polynôme non constant, alors il existe a € K* et des 
polynômes unitaires distincts P1,...,P, et des entiers m1,...,m, tous > 1 tels que : 


P=aP"...prr 


96 


De plus les P,;, les m; et a sont uniques. 


Démonstration: La démonstration est entièrement analogue à celle faite dans Z. Il 
faut seulement observer que les polynômes inversibles (i.e. les P tels qu’il existe Q avec 
PQ = 1) sont les polynômes constants non nuls. Ü 


Exemple : reprenons les polynômes À et B dont nous avons calculé le PGCD. Dans 
QIX]onaA=(X?+X+1)(X4+1)et B=(X?2+X+1)(X2-X+1)(X +1) alors que sur 
RIX|onaA=(X?2+X+1)(X?2+V2X +1)(X2-424+1)et B = (X?+X+1)(X2-X+ 
1)(X +1) et sur C[X|onaA=(X-j)(X-j)et B=(X—-j)(X—-35)(X+j)(X —-35)(X +1) 
(où l’on note j := —5 + iv). 

Remarque : on peut montrer que X[X] possède une infinité de polynômes irréductibles 
unitaires en “copiant” la démonstration faite pour les nombres premiers. 


6.2 RACINES D'UN POLYNÔME 


On étudie dans ce paragraphe les premières propriétés de la fonction associée à un 
polynôme : si P := ao + XX +...+a, X" € K[X] alors on peut lui associer la fonction 
de K dans K définie par x + ao + ait +...+a,x". En particulier on s'intéresse aux 
valeurs de cette fonction ; en fait il nous suffira de regarder quand la fonction s’annule, ce 
qui nous amène à la notion de racine d’un polynôme. 


PROPOSITION: Soit P € K[X| et soit à € K alors P(a) = 0 si et seulement si 
(X — à) divise P. 

Démonstration: SiP=(X-a)Q alors visiblement P(a) = 0. Supposons inversement 
que P(a) = 0 et effectuons la division de P par X —- a. Ona P=(X -a)Q +R avec 


R = 0 ou deg(R) < deg(X — a) = 1 ; donc R est constant et en calculant P(a) on trouve 
que R = P(a) donc R=0 et X —- a divise P. O 


Définition: On dit que a est une racine de P si P(a) = 0 ou si (X — à) divise P. On 
dit que a est une racine d'ordre r de P si (X — a)" divise P mais (X — a)"*! ne divise 
pas P. 


THÉORÈME: Un polynôme de degré n possède au plus n racines (comptée avec 


multiplicités). 
Démonstration: Supposons que &1,...,a@, soient des éléments distincts et racines 
d'ordre m1,...,m, de P alors les polynômes (X — a;)” sont premiers entre eux (deux 


à deux) et divisent P donc leur produit divise P. Or le produit [[5_,(X — a;)"# a pour 
degré D °_, m; donc D ;_, m; < deg(P)=n. E 


Par analogie avec le calcul différentiel, on peut définir la dérivée d’un polynôme et il 
est raisonnable de penser que l’annulation des dérivées correspond à une racine multiple. 
Pour démontrer cela on établit la “formule de Taylor pour les polynômes” qui servira de 
prototype pour la formule de Taylor générale (chapitre 14). 


Définition: Soit P = anX" + an_1X"71... + a1X + ao un polynôme, le polynôme 
dérivé est P' := na, Xl +{(n—1)jas 1X7-2...+ a. On note PU) la dérivée n-ème 
définit par PUH) 2 (pUy, 
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Cette opération de dérivation est donc définie sans passage à la limite mais jouit des 
mêmes propriétés que la dérivation des fonctions : 


PROPOSITION: (P+Q) =P'+Q! 
(PQ) = PQ + PQ! 


Plus généralement on a la formule Leibniz 


(PQ)") = >» Ci PU)QU=) 


i=0 


Les propriétés suivantes sont équivalentes : 
(i) P possède un racine d'ordre r en X = a 
(ii) P(a) = P'(a) =...= PU-U (a) = 0 et PU) (a) Z 0 


Démonstration: La démonstration de la première formule est laissée en exercice. Pour 
la deuxième formule on se ramène facilement au cas où P = X" et Q = X7 ; alors 
PQ' +QP' = X"(MmXM TT) + XM (NX D) = (m + n)XMPR TL 2 (PQ). Un calcul par 
récurrence, à partir de la formule précédente donne la formule de Leibniz (ce calcul est fait 
au chapitre 14 pour la dérivation usuelle). 

Si P possède une racine d'ordre r en « alors P = (X — a)"Q avec X — à ne divisant 
pas Q donc Q(a) Z 0. En appliquant la formule de Leibniz on voit que 


P(a) = P'(a) = ...= PT (a) = 0 
et PU) (a) = rlQ(a) £ 0. Pour établir la réciproque on va se servir de la formule suivante : 


PROPOSITION: (Formule de Taylor pour les polynômes) Soit P un polynôme de 
degré n et à € K alors 


PO)(@) 
2! 


PU)(a) 


P = P(a) + PO (a)(X — à) + I 


(X =) +:.:+ 


(X—a)" 


Démonstration: (de la formule de Taylor) Tout polynôme P de degré n peut s’écrire 
P=) 9a(X — a) (en effet il suffit de le vérifier pour P = XF et XF =(X -a+a)* = 
SUR Ciak-i(X-—a)'). La dérivation étant additive il suffit de vérifier la formule de Taylor 
pour le polynôme P = (X — «)'. Mais dans ce cas P(a) = P'(a) =... = PK) (a) = 0 
et PW)(a) = k! donc la formule est vraie. 

Terminons maintenant la preuve de la proposition : 


Si P(a) = P'(a) =...= PC (a) = 0 et PU) (a) £ 0 alors 


pe D Ex ae ar (ET + 3 Ex or) 
i=0 


L i=Tr+1 
; L _ : PO (@) 
et on a bien P = (X — a)'Q avec Q(a) = —5+ £0. 0 
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Remarque : Jusqu'à présent nous aurions pu supposer le corps K commutatif quel- 
conque, par exemple À = Z/pZ mais la formule de Taylor n’est pas valable (telle quelle) 
sur Z/pZ et de “drôles de choses” peuvent arriver en dérivant les polynômes : considérons 
le polynôme P = X% + XP +1 alors P n’est pas constant et pourtant P’ = 0 ; par ailleurs, 
d’après le “petit” théorème de Fermat, le polynôme P = XP — X à pour racine tous les 
éléments du corps Z/pZ. 


Explicitons maintenant la factorisation des polynômes à coefficients dans R et C 


THÉORÈME:  (Factorisation dans R[X] et C[X]) 


(i) Les polynômes irréductibles dans C[X] sont les polynômes du premier degré ; tout 
polynôme de degré n se factorise sous la forme : 


P=anX" +...+a0 = an(X — )71...(X —-a,)7r 


avec les à; distincts et m1 +...+m, =n. 


(ii) Les polynômes irréductibles dans R{X\| sont les polynômes du premier degré et les 
polynômes du second degré de la forme P = aX? +bX + c avec b? — 4ac < 0 ; 


Remarque : on voit ainsi que, sur R, tout polynôme de degré n se factorise sous la 
forme : 


Pa GRR, = R = di) Na TEL EDR Poe OX ER Xe)" 


avec les a; réels distincts, les couples (b;, c;) distincts vérifiant b? — 4c; < O0 et m3 +... + 
My + 2(N1 +... +ns) =n. 


Démonstration:  (i) Il faut démontrer que les seuls polynômes unitaires irréductibles 
sur C sont les X — & mais ceci est clair car tout polynôme non constant possède un facteur 
de ce type d’après le théorème de d’Alembert-Gauss. 

(ii) Il faut démontrer que les seuls polynômes unitaires irréductibles sur R sont les 
X —œet les X? + bX + c (avec b? — 4c < 0). Pour cela soit P un polynôme unitaire 
irréductible ; il possède une racine complexe a. Sia € R alors X — a divise P et donc 
P = X — à. Sinon, observons que, comme P est à coefficient réel : 


d’autre part (X — a)(X —&) = X?—2Re(a)X +|al? est à coefficient réel et divise P donc 
P=X?-2Re(a)X +l|a/?. D 


Terminons ce paragraphe en étudiant, sur R, le graphe des fonctions polynômes de 
degré < 3 : 


99 


Si P = aX + b on obtient une droite : 


Si P = aX? +bX + c on obtient une parabole qui a pour axe de symétrie la droite 


verticale x — — À 
(87 


Si P = aX° + bX? + cX + d on obtient une cubique qui a toujours un point de 
symétrie ; pour étudier le signe de la dérivée P = 3ax? + 2bX + c, on a besoin du signe de 
À := Bb? — 3ac 


6.3 FRACTIONS RATIONNELLES 


Une fraction rationnelle F à une indéterminée est une expression du type F — 5 avec 
P et Q polynômes (Q est supposé non nul et bien sûr SE — £). L'ensemble des fractions 


rationnelles forme un corps qu’on peut construire formellement à partir de l’anneau des 
polynômes de la même façon que Q est construit à partir de Z. 


Définition: Un élément simple de C(X) est une fraction rationnelle de la forme : 


avec a, bE Cetne N*. 
Un élément simple de R(X) est une fraction rationnelle de la forme : 
b cX +d 


De = 
(eo (X2 + aX +6) 


avec a, b,c, dE R et n € N* et (dans le deuxième cas a? — 4b < 0). 
L'intérêt de cette notion est illustré par le théorème suivant : 


THÉORÈME: Soit K — R ou C, une fraction rationnelle de K(X) peut s'écrire 
de manière unique comme somme d’un polynôme et d'éléments simples, cette écriture 
s'appelle la décomposition en éléments simples de la fraction rationnelle. 
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3 
XIE EX EL est EF — 


Exemples : La décomposition en éléments simples de F — RE 


jee ete 
R=D GED FX 
Remarque : l’unicité de cette décomposition est très utile pour la calculer comme on 
le verra sur les exemples. Nous allons faire la démonstration sur C et laissons le lecteur 
adapter l’argument au corps des réels ; en fait si Fest une fraction à coefficient réels, on 
peut la décomposer en éléments simples sur R et sur C. 


Démonstration:  (Unicité) Il suffit de voir que si : 


F = PAS en = 0 


== ? 


alors les coefficients b;; et le polynôme P sont nuls. Pour cela multiplions F par (X —a;)"" ; 

on obtient une égalité de la forme 0 = (X —a;)""F = b;n, +(X —a;)G avec G une fraction 

rationnelle sans pôle en a;. En calculant les valeurs en a;, on obtient donc b;», = 0. En 
répétant l’opération pour chaque coefficient on obtient b;; — 0 et donc P — 0. 

(existence) Commençons par observer que si P et Q sont des polynômes premiers entre 

eux alors, d’après le théorème de Bézout, il existe deux polynômes À, B tels que AP+BQ — 

: donc toute fraction rationnelle de la forme F = 25 peut s’écrire F — RCEEEO = 


à +2. Par ailleurs tout polynôme s'écrit à un coefficient près . IL (X—a;)""* done 


= € ns 
toute ns rationnelle F = % va se décomposer en »};_; er Le mais si on utilise 


maintenant la “formule de Taylor” pour P,; au point a; on obtient P; — Red i) Pi (X —a;)? 
d’où en reportant une expression de F comme somme d’éléments simples et de polynômes. 
[] 


L'utilisation la plus fréquente de la décomposition en éléments simples est le calcul 
de primitives (voir chapitre 17) mais elle peut être ne dr pour calculer la dérivée 


| : mn XS+X24EX 1 1 
n-ème ; par exemple si F= = 1+- 


—X ms 4 + alors, comme on sait que 


J Ten) = Logit nn al + C” on en tire 


| ro - 


En observant que (#)"() = (1) 


arr on en tire : 


FC) = (1) ne ROUE +) 


Pratique de la décomposition en éléments simples : On peut appliquer la méthode sui- 
vante : on factorise le dénominateur, puis on écrit formellement le type de la décomposition 
en éléments simples avec des coefficients inconnus, on calcule ensuite ces coefficients à l’aide 
des lemmes qui suivent. 
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La partie polynômiale de la décomposition simple s’appelle la partie entière de la 
fraction rationnelle ; elle se calcule ainsi : 


LEMME: Soit F = P/Q une fraction rationnelle et soit E le quotient de la division de 
P par Q, i.e. P = EQ +R avec deg(R) < deg Q alors E est la partie entière de la fraction 
F. 


Démonstration: En effet, en réduisant au même dénominateur la somme des éléments 
simples, on obtient une égalité de la forme F = E+R/Q avec P, R polynômes et deg(R) < 
deg(Q) — 1. Après multiplication par Q cette égalité devient P = EQ + R qui indique que 
E est le quotient de P par Q et R le reste puisque deg(R) < deg(Q). O 


Il est également aisé de trouver le coefficient correspondant à un pôle d’ordre maximal : 


LEMME: Soit Q = (X — a)”"Q1 avec Qi(a) £ 0 et F — P/Q dont la décomposition 
s'écrit: F= x +... alors um = P(a)/Q1(a) = m!P(a)}/Q(") (a). 


Démonstration: Ona(X-a)"F = P/Q:1 = um+(X—a)G avec G fraction rationnelle 
sans pôle en a ; en calculant les valeurs pour X = a, on en déduit um = P(a)/Q1(a). Par 
ailleur la formule de Leibniz nous donne QÜ")(a) = m!Q1(a) d'où la deuxième expression. 
[] 


Ces deux lemmes sont déjà suffisants pour calculer la décomposition d’une fraction 
rationnelle sans pôle double. 
2n 
Exemple : soit F = -#— on effectue la division X?" = (X" +1)(X" —1)+1; 
on sait que les racines de X” — 1 sont les racines n-èmes de l’unité et on peut factoriser 
XT—1— Es (X — an) avec an := exp(27) d’où une expression a priori : 


n—1 


Uh 
Fr 


D'après le premier lemme on a E — X” +1 et si on applique le deuxième lemme avec 
2n 
P= Xe O = XT = Ton obtient uy= er = an/n et donc 
X?2 


n—1 
. 1 Ah 
EF = ———— = X"+1 
Xn —1 de ge 


— ah) 


Pour traiter les calculs avec des pôles multiples le plus économique est d’utiliser le 
lemme suivant : 


LEMME: (division aux puissances croissantes) Soit à € K, P,Q € KI[X] avec Q(a) Z 0 
alors pour tout k € N il existe a; € K et RE KÏXT tels que : 

Pos FalX =04) Eau sa) DOLCX =a)R 
En particulier si F := P/(X —a)*Q alors la partie de la décomposition en éléments simples 
de F correspondant au pôle a s'écrit : 


ao Ak—1 
ro) ue 
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Démonstration:  Observons que le polynôme P — (P(a)/Q(a))Q s’annule en a donc 
P—(P(a)/Q(a))Q = (X—a)R ; raisonnons maintenant par récurrence sur k et supposons 
P = (ao + a1(X — à) +. + ag-1(X = à) DQ + (X = a) Ry ; on sait que Rx — 
rQ +(X — a)Ry11 (avec r := R£(a)/Q(a)) d'où P = (ao + a (X — à) +... + ax_1(X — 
a) + r(X — a)F)Q + (X — a) +1R;,1. La deuxième affirmation est immédiate. [ 
xX10 + X2 se 1 

Exemple : f = XIZIXSIX 
simples sur C et en déduire celle sur R. Cette fraction est aussi l’occasion de faire des 
remarques sur l’utilisation des symétries (coefficients réels, parité). 

Factorisation : le polynôme Q := X° — 2X° + X se décompose en : 

X(X4—-1}}= X(X —1)(X +1) (X2 +1) = X(X —1)2(X + 1)2(X + i)2(X — i)? 

Décomposition à priori de f avec À, B,C,D,E,F,G,H,IEeCetRE C[X|: 


Nous allons calculer la décomposition en éléments 


A B C 1 E F G H I 


PR EL NE =D 2 0 en DE) 


Utilisation des symétries : on sait que f — f et on observe que f(X) = —f(—X) ; 
en reportant cela dans la décomposition et en utilisant l’unicité de la décomposition on 
obtient R(X) = -R(-X), B=D,E=-C,F =H et I = —-G d’une part et d’autre part 
Per A=A;B=B;C=C;D=D;ÈZ=E, FES, G=T d'où l'ontire que A,B, 
C, F sont réels (et D = B, E = —C) et G est imaginaire pur (et 1 = —-G). 

Le premier lemme permet de calculer R : on trouve R — X (qui est bien impair et à 
coefficients réels). 

Le deuxième lemme permet de calculer À (et si on voulait Cet G) : fo := Xf — 
Li donc-Jo(0) =4="1 

Le troisième lemme permet de calculer simultanémént C et B : 

Q = (X +1)? Q1 avec Q1 = X7 — 2X6 + 3XS — 4X4 + 3X$ — 2X2 + X d'où l’on 
tire (par la formule de Taylor par exemple) Q1 = —16 + 64(X + 1) + (X + 1)2Q2 et de 
même P = XI04+X?24+1—=3-12(X +1)+(X +1)7P2 d’où l'écriture de la division aux 
puissances croissantes de P par Q par rapport à (X +1): 


3—12(X +1) = (ao + @1(X + 1))(—16+ 64(X +1))+(X +1)°R 


d’où l’on tire ao = —3/16 et a = 0 soit C = —3/16 et B = 0 

On procède de même pour les coefficients G et F : On a Q = (X — i)}?Q; avec 
Q:; = X(X? —1)?(X +i)?. Ceci permet de calculer Q;(i) = —164 et Q{(i) = —64 d’où 
Qi = —16i — GA(X — i) + (X —i)Q2. De la même façon P(i) = —1 et P'(i) = 121 donc 
P=-1+12(X —i) +(X —i)?P2 d’où l'écriture de la division aux puissances croissantes 
de P par Q; par rapport à (X — à) : 


—1+12(X — à) = (bo + b1(X — à))(— 164 — 6A(X — i)) + (X —i)?R 
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d’où l’on tire aisément G — bo — —i/16 et EF = b1 — —-1/2 (on vérifie bien que G est 
purement imaginaire et F réel). 
Conclusion : f s'écrit : 


hd .Le710 3/16 1/2, —i/16 , 1/2 i/16 


AE EE LC GR) PN EE et SU en ee a 


Pour obtenir la décomposition sur R il suffit ici de regrouper les termes complexes 


Se ee RE i De nn EX 
CONJUBUÉS : Tr + XD — NAT et CD — D (2 1p donc 


on —3 > 3 X . X 
E X  16(X +1)? 16(X —-1)}2 X2+1 A(X2+1)? 


Remarque. On peut souvent utiliser avantageusement un calcul de valeur particulière 
ou de limite pour calculer certains coefficients ou des relations entre eux. Par exemple, en 
gardant les notations de l’exemple précédent, une fois calculé À, on a facilement F — R — 
(2X6 +1)/(X° —2X5 + X) donc 


lim x(F(x)— R(x))=0=A+B+D+F+H. 


T—00 


On voit qu’il n’y a pas de difficulté fondamentale pour calculer la décomposition en 
éléments simples sinon celle de bien ordonner les calculs. 


Noether Emmy (1882-1935 ) 


64 


CHAPITRE 7 MATRICES 


Ce chapitre introduit un outil de calcul très commode : les matrices. Celles-ci sont 
définies comme un tableau de nombres mais on en verra une interprétation plus abstraite 
au chapitre 9. La technique centrale de ce chapitre est celle dite du “pivot de Gauss” qui 
est à la fois simple, efficace et versatile. 


7.1 OPÉRATIONS SUR LES MATRICES 


Définition: Soient m,n > 1 des entiers ; une matrice m x n est un tableau de nombres 
avec m lignes et n colonnes : 


@11 a12 din 
Pre @21 a22 on 
m1 m2 -:. Amn 


Les éléments a;; s'appellent les coefficients de la matrice À. Par convention, le premier 
indice est le numéro de la ligne, le deuxième indice est le numéro de la colonne. On 
désignera par Mat(m x n,R) l’ensemble des matrices m x n à coefficients dans R. 


Remarque : on travaillera pour le moment avec des nombres réels mais il n’y a pas de 
difficulté à étendre les notions de ce chapitre au cas où les coefficients sont dans un corps 
commutatif K. 


Exemple : À — (. . E: 1) est une matrice 2 x 4 et son coefficient a22 est égal 


à 2, alors que a13 = 3. 
Une matrice 1 x n est un vecteur ligne. Une matrice m x 1 est un vecteur colonne. 
Définissons maintenant les opérations sur les matrices : 
Addition : 
Si A:= (a;;) et B := (b;;) sont des matrices m x n alors A+ B est une matrice mxn 
dont les coefficients sont donnés par ci; := ai; + b;;. 


E LS 0 —-1 3 4 É de 2040 COX Le car 4 
Fa PR A De 4 ES DD AS ES 
Multiplication par un scalaire : Si À := (a;;) est une matrice mxnetaeR alors 
aA est une matrice m x n dont les coefficients sont donnés par ci; := a&ij. 


Re 3( 1 —1 3 1) e É 3 —-3 9 2) 
1 2 —3 4 1 3 6 —9 12 3 
Enfin l’opération la plus intéressante (et la plus compliquée) : 
Multiplication de deux matrices : 
Si A:= (a;;) et B := (b;;) sont des matrices m x n et n x p alors AB est une matrice 
m x p dont les coefficients sont donnés par c;; := Her Qikkj- 
Remarque : il faut bien noter que la multiplication de deux matrices n’est définie que 


si le nombre de colonnes de la première matrice est égal au nombre de lignes de la seconde 
matrice. 
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Cas particulier : Le produit d’un vecteur ligne par un vecteur colonne (de même 
longueur) est un nombre : 


V1 
V2 
Ci -@5 es AS © = L1y1 + X2Y9 +... + TnYn 
Un 
1 
Exemple : (3 —1 4)| —1 | =0 
—] 


(ce produit est en fait le produit scalaire et la dernière égalité signifie que les vecteurs 
(3, —1,4) et (1, —1, —1) sont orthogonaux). 

Cas général : Le produit d’une matrice s’obtient en faisant le produit de chaque ligne 
de la première matrice par les colonnes de la seconde : 


b11 ad bi; Pr bip 
&11 Ain C11 Cip 
Qi1 Ain _— Cij 
Ami Pie sue Amn : Cmli Cmp 
Dites, er css (Qe 
Exemple : 
dl 0 
0 —1 3 4 1 2 L __f—5 —5 —-4 
1 2 —3 4 O —1 —1 —1 8 5) 
—1 O0 0 


Plus généralement on peut faire le produit de matrices par blocs (de tailles compatibles) : 


A B A! B'\ {f AA'+BC' AB'+BD' 
C D C" D'} \CA'+DC' CB'+DD' 
où À,B,..., D’ sont des matrices, en les manipulant comme des scalaires, mais en faisant 
attention à ne pas les faire commuter car : 
La multiplication des matrices n’est pas commutative, on a en général AB Æ BA, 


CS Rd ea: roi 
PRPRRORPERR  br e Lor et D ACL LEE ou 


On peut aussi rajouter une opération qui est plutôt une notation : on peut juxtaposer 
une matrice m x n et une matrice m x r pour obtenir une matrice m x (n+r). Si Aet B 
sont les deux matrices initiales, on note la nouvelle matrice (A[B) 
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Les matrices permettent de compacter des formules et donc de les manipuler de façon 
plus efficace ; nous allons appliquer cela au problème de la résolution d’un système linéaire, 
c'est-à-dire d’un système d’équation du type : 


@1121 +... + Ginln = Di 


Am1T1 +... + AmnTn = Om 


On peut réécrire un tel système en termes de matrices en posant 


T1 b: 
A = Cas LE— : et b :— 
TE bn 
Alors le système équivaut à : 
AX =b 


Avant de manipuler plus avant les matrices, il convient de connaître les règles de calcul : 
PROPOSITION: Les opérations sur les matrices vérifient les règles suivantes : 

1) (distributivité) A(B + C) = AB + AC et (A + B)C = AC + BC 

2) (associativité) (AB)C = A(BC) 

3) (compatibilité) a(AB) = (aA)B = A(aB) 


Démonstration: La vérification ne présente pas de difficulté. D 


On peut aussi introduire des matrices particulières : 

La matrice nulle m x n est la matrice dont tous les coefficients sont nuls ; on la note 
Oynn où simplement 0 si le contexte rend clair sa taille. Observons que pour toute matrice 
A:(dé taille n:Xp) on 4 0x4 = 0: 

La matrice identité m x m est la matrice dont tous les coefficients sont nuls sauf ceux 
situés sur la diagonale qui valent 1 ; on la note /,, ou simplement J si le contexte rend 


clair sa taille. Ainsi 
1 0 


0 1 
(où les coefficients laissés en blanc sont nuls). Observons que pour toute matrice À de 
taille m x n on a /,, À = À = Al,. 
Une matrice diagonale m x m est une matrice dont tous les coefficients sont nuls sauf 
ceux situés sur la diagonale ; ainsi 


d11 0 


0 Gris 
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(où les coefficients laissés en blanc sont nuls). 
Une matrice triangulaire supérieure m X m est une matrice dont tous les coefficients 
sont nuls sauf ceux sur la diagonale et au dessus de la diagonale ; ainsi 


Œ1  *  *  % x 
A22 *  * * 
F—= x * 
x 

0 QGmm 


(où les coefficients laissés en blanc sont nuls et les étoiles désignent des coefficients quel- 
conques). 


COROLLAIRE: L'ensemble des matrices carrées Mat(n x n,R), muni de l’addition 
et de la multiplication est un anneau ; si n = 1 c’est un corps “égal” à R, sin > 2 c’est 
un anneau non commutatif qui n’est pas un Corps. 


Démonstration: Les propriétés d’anneau sont contenues dans les propriétés générales 

des matrices, l’élément neutre de la loi d’addition étant 0,, et l’élément neutre de la 

multiplication étant Z,. On a déjà vu que l’anneau n’est pas commutatif si n — 2 et de 
à : 0 1 0 1 i 

même ce n’est pas un corps car ( 0 À ( 0 ;. — 022 est nul sans qu'aucun des facteurs 

ne soit nul. D 


Il est donc intéressant de rechercher si une matrice a un inverse (à gauche ou à droite 
si elle n’est pas carrée). Faisons le explicitement sur les matrices 2 x 2 : observons que 


é À é ps = (ad — bc)I3 


On voit donc que si ad — bc Æ 0 alors la matrice À — É à est inversible et 


4 _—b 
RUE ad—bc  ad—bc 
ad—bc ad—bc 
D'autre part si on à ad — bc = 0 la matrice À n’est pas inversible car sinon on obtiendrait 


É … = 0.12 = 022 et donc À = 022 ce qui serait contradictoire. 

Un intérêt clair du calcul de l’inverse d’une matrice (quand il existe) est la résolution 
des systèmes linéaires associés : en effet si À est inversible alors AX — b équivaut à 
X = A-!b. Il est néanmoins rare que l’on ait recours a cette méthode : tout d’abord 
elle ne s’adapte qu’à des cas particuliers et ensuite il existe une méthode permettant de 
traiter tous les cas et qui de plus est beaucoup plus pratique et performante du point de 
vue algorithmique (et qui fournit l’inverse quand il existe). 
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7.2 LA MÉTHODE DU PIVOT 
On décrit une procédure de résolution des systèmes linéaires : l’idée est de se ramener 


à un système triangulaire que l’on peut ensuite résoudre simplement. 


Définition: Une opération élémentaire sur les lignes d’une matrice consiste à : 


— Remplacer une ligne L; par la ligne L; + L; (avec à £ j). 
— Echanger deux lignes. 
— Multiplier une ligne par un scalaire non nul. 


Remarque : en combinant ces opérations, on voit qu’on peut remplacer L; par L;+aL;. 


Montrons sur un exemple que ces opérations permettent de simplifier considérablement 
une matrice ; indiquons par une flèche le fait de passer à une autre matrice (par une 
opération élémentaire). 


4 1 
0 0 
2 0 
3 À 1 0 2 3 4 J2107 ie 4 
ET 
0 0 Ü0: 1 28/4: 05 
9/2 3 
_17/4 5/2 
Ou 50, L 2924 12 


Le grand intérêt, du point de vue de la résolution des systèmes linéaires, est le suivant : 
THÉORÈME: Considérons le système linéaire 
(x)  AX =b 


Supposons que l’on passe de la matrice A1 := (A |b) à la matrice A2 := ( A’ | b') par une 
succession d'opérations élémentaires, alors les solutions du système linéaire : 


(xx) A'X = b' 
sont les mêmes que celles du système (*). 


Démonstration: Echanger l’ordre de deux équations ou en multiplier une, par un 
scalaire non nul, ne change pas les solutions ; passer de deux équations Li = Lo = 0 à 
deux autres équations Li + aL2 = La = 0 n’en change pas les solutions, d’où l’énoncé. TO 


Exemple : Le système d'équations 
T1  +2%3 +3%4 = 4 
x] +9 — T3 +xza —=0 


2%: +t2 —3T3 +724 = 2 
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possède les mêmes solutions que le système : 


T1 Sp —"9 
T =. 5 
T2 T4 T4 D Ty 

st 

T3 — 414 5 


Or résoudre ce dernier système est immédiat ; on donne une valeur arbitraire à æ4 et on 
en tire : 


PA = ja +3 
T2 = 2 
T3 = lat 


En vue de donner une autre preuve du théorème, interprétons les opérations élémen- 
taires en termes de matrices : soit 


1 


la matrice dont tous les coefficients sont nuls sauf ceux situés sur la diagonale qui valent 1 
et le coefficient {k (£{-ème ligne et k-ème colonne) qui vaut a. Calculons E A en appelant 
a;; les coefficients de À et c;; ceux de E A. Un calcul direct donne que si à Æ € alors 
Cij = &ij alors que Ce; = àej + Qax;, donc : 


Multiplier à gauche par E revient à transformer À en ajoutant à sa /-ème ligne à fois 
sa k-ème ligne. 


On vérifiera que : 
Multiplier à gauche par 


{ 


la matrice À revient à échanger les i-ème et j-ème lignes de A. 


Galet 


Multiplier à gauche par 


Exemple : 
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la matrice À revient à multiplier la i-ème ligne de À par a. 


En résumé on voit que l’on passe d’une matrice A, à une matrice A2 par une suite 
d'opérations élémentaires si il existe une suite de matrices E1,E2, ..., E, chacune de l’un 
des trois types précédents telles que A2 = E1E£2...E,A1. En particulier, si l’on revient aux 
systèmes linéaires, l'égalité (4’ | b') = E1E2...E,(A | b) équivaut à 4’ = E1E2...E,A et 
bd — E1E5...E,b donc les systèmes AX = b et A'X — b’ sont équivalents. 


Voyons maintenant quelle est la forme la plus simple que l’on puisse obtenir pour une 
matrice (ou un système linéaire). 


Définition: Une matrice est échelonnée si 

1) Le premier coefficient non nul d’une ligne est 1 (on dit que c’est un pivot). 

2) Le premier coefficient non nul de la (à + 1)-ème ligne est à droite de celui de la 
i-ème ligne. 

3) Les coefficients au dessus d’un pivot sont nuls. 


Exemple : 
Li e0 10 co vi 
1, 2:00. ‘OL À 0 1 0 —-2 1 
0 O0 1 —-2 9]! et | 0 0 1 0 2 
OO ON NL 0 6 20.0 #02 10 
0:00? 205 : :0:° 70 


sont échelonnées. 

Remarques : Une ligne est soit nulle soit de la forme (0,...,0,1,*,...,x) ; si une ligne 
est nulle, toutes les lignes situées en dessous sont nulles. 

Indiquons comment, en pratique, on peut appliquer des transformations élémentaires 
à n'importe quelle matrice pour la rendre échelonnée : on choisit un coefficient non nul 
situé le plus à gauche possible ; par multiplication par un scalaire et échange des lignes on 
se ramène au cas ou ce coefficient est 1 et est situé sur la première ligne : 


0 O 1 x x 
A'=1{0 O x *x * 
0 O x *%x x 


En ajoutant à chacune des lignes un multiple adéquat de la première ligne on fait apparaître 
des zéros en dessous du pivot 1 de la première ligne. On répète l’opération sans toucher la 
première ligne et au bout d’un certain temps on arrive à une matrice du type : 


0 O 1 %x x x  *% 
A"=1|0 O O0 1 x x *% 
0 0 0 0 0 1 x 


Et il ne reste qu’à faire apparaître des zéros au dessus de chaque pivot, ce qui peut se faire 
en retranchant un multiple adéquat de la ligne du pivot. 


Il nous reste à discuter de la résolution des systèmes échelonnés. 


CL 


THÉORÈME: Soit AX — b un système d’équation tel que la matrice (Ab) soit 
échelonnée. 

1) Le système possède une solution si et seulement si il n’y a pas de pivot sur la 
dernière colonne. 

2) Si il n'y a pas de pivot sur la dernière colonne, la solution générale du système 
s'obtient en fixant arbitrairement chacun des x; tels que la i-ème colonne ne contienne pas 
de pivot et en calculant chacun des autres x; en fonction de ceux-là grâce à l’équation 
correspondant à la i-ème ligne. 


Exemples : La matrice 


(AÏb) = 


SO OM 
© © N 
OO HR © 
OO © 
© & N 
r © © 


possède un pivot sur la dernière colonne et le système associé : 


1 +2%9 +xta +2%5 —=0 
Z3 +3x4a +4xs —0 
0 =] 


n’a évidemment pas de solution. 
La matrice 


ni 


(AÏb) = 


© 
© © © 


0 


ne possède pas de pivot sur la dernière colonne et le système associé a pour solutions 
Zi = 2 —X4a — 225, ts = 1 — 3x4 — 4x5, les coordonnée x2,x4 et x5 des solutions étant 
arbitraires. 


COROLLAIRE: Un système linéaire homogène (c'est-à-dire b — 0) avec m équations, 
n inconnues et n > m possède au moins une solution non nulle. 


Démonstration: En effet un système homogène possède toujours une solution : le 
vecteur nul ; ensuite le décompte des équations et variables entraîne que, une fois le système 
rendu échelonné, une variable au moins va pouvoir prendre n’importe quelle valeur. Ê 


APPLICATION: Calcul de l’inverse d’une matrice par opération élémentaires : 

Pour calculer l’inverse d’une matrice À carrée n x n on réduit par opération élémentai- 
res la matrice (A | Z,) à une matrice échelonnée ; si la matrice À est inversible la matrice 
échelonnée obtenue sera (J, | A1). 


Démonstration: La seule matrice carrée inversible et échelonnée est l’identité, donc la 
réduction de la matrice À est de la forme suivante : E,...E1A = I avec E; des matrices 
correspondant à des opérations élémentaires. La réduction à une matrice échelonnée de 
(A | I) est donc E,...E1(A | I) = (I | E,...ÆE:1) mais l'identité E,...E1A = I signifie 
précisément que E,...Æ1 = ALTO 
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2 1 
1 O0 | on peut calculer son inverse a l’aide des opérations : 
0 1 


5 
1 
2 
5 2 1 1 0 0 0 —3 1 1 —-5 0 
11001 0J—-11 1 0 0 1 O!|— 
2 0 1 0 O0 1 0 —2 1 0 —-2 1] 
L À 0 0 1 0 l À 0 0 1 0 
D + 0 0 à Al SC à SE à À ls 
0 —3 1 1 —5 0 O O0 —1/2 1 —2 —3/2 
1 1 0 O I 0 1 0 0 1 —2 —-]1 
O 1 —1/2 O0 1 —1/2|—|0 1 0 —-1 3 1 
0 O0 1 —2 4 3 0 0 1 —2 4 3 
Ainsi l’on a : 
1 —2 1 
At + + À 
—2 4 3 


ce que l’on peut d’ailleurs vérifier directement. 

Remarque : si en échelonnant la matrice (A|7) on trouve une matrice (B|C) avec 
B I alors on peut conclure que À n’est pas inversible. En effet il suffit d'observer que les 
matrices élémentaires sont toutes inversibles (permuter deux fois deux lignes revient à ne 
rien changer, de même ajouter puis retrancher un multiple d’une ligne ou multiplier puis 
diviser par un scalaire non nul). 


Exemple : cherchons par cette méthode l’inverse, s’il existe de À = È 4 


dl $ À 0 1 $ À 0 1 3 1 O0 1 3 O0 à 
—> + 1 =? 1 
2 6 0 À dr: = À 0 O0 1 —à 0 0 1 —à 


donc À n’est pas inversible. 


«| : 
| {il 
| 
| 


AE, 720 


ROWAN HAMILTON 


Hamilton William Rowan (1805-1865) 
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CHAPITRE 8 ESPACES VECTORIELS 


Le petit prince demanda “Dessine-moi un espace vectoriel”. Le pilote commença par 
le dessin suivant : 


et lui commenta : “Voila, les vecteurs c’est comme ça, on les note avec des flèches 
au-dessus, on peut les ajouter, les multiplier par un nombre”. 
Le petit prince, un peu étonné, lui répondit, non sans quelques raisons : “Mais 


pourquoi parler de vecteurs pour ajouter des nombres? Et mettre des flèches, c’est un 
peu enfantin, non? Tu crois que je ne saurai pas reconnaître un vecteur sans sa flèche?” 

Un peu vexé, Antoine essaya un deuxième dessin en se justifiant ainsi : “C'était un 
espace vectoriel de dimension 1, en voila un de dimension 2 ; et je t'ai enlevé les flèches!” 


L'enfant contempla le nouveau dessin et ajouta un peu perplexe : “Ecoute, ta planète 
n’est déjà pas vraiment plate, mais la mienne ne l’est vraiment pas !”. L'’aviateur grommela 
“Bon d’accord” et dessina ceci : 


Le petit prince contempla avec plaisir ce troisième dessin mais au bout d’un moment 
il s’inquiéta : “Mais ...on ne peut pas voir les mouvements ... le temps ... est-ce-qu'on ne 
pourrait pas rajouter une dimension?”. Carrément agacé, l’homme fit le dessin suivant : 


et ajouta : “Tiens! J'ai mis dans ce coffre un cours d’algèbre linéaire où tu trouveras 
des espaces de dimension 4 et aussi de dimension n et peut-être même (je ne me souviens 
plus) des exemples d’espaces vectoriels de dimension infinie”. 

Le petit prince s’en fut, très content. 


8.1 INTRODUCTION À L'ALGÈBRE LINÉAIRE 


L'exemple type de l’espace vectoriel, au niveau de ce cours, est l’espace R?. Nous 
noterons le plus souvent e = (%1,...,x%,) un élément (un vecteur) de R” et nous appellerons 
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coordonnées du vecteur e les nombres réels x;. On utilisera toutefois aussi, de temps en 
T1 


temps, la notation en vecteur colonne e — 


Tn 
On dispose de deux opérations fontamentales sur R? : 
l'addition : 
Leds) ef = ir )alors 


e+f:=(x1+y1,...,Tn + Un) 


la multiplication par un scalaire : 
sie—=(t1,...,12)eta€eR alors 


her lari.22100) 


Bien entendu on ne peut “dessiner” cet espace que lorsque n = 1,2 ou 3. Nous ne 
formalisons les propriétés d’un espace vectoriel que dans le paragraphe suivant, mais sur 
cet exemple les propriétés sont bien connues. 

Pourquoi considérer une dimension quelconque? Une première (et mauvaise?) réponse 
est que les mathématiciens aiment bien travailler dans la plus grande généralité possible 
et que ce sont eux qui décident du contenu des cours de première année. Une deuxième 
(et meilleure?) réponse est que presque tous les problèmes de la vie courante moderne 
conduisent à des espaces de dimension plus grande que 4. Nous ne pensons pas à l’espace- 
temps de dimension 4 dans la théorie d’Einstein, mais à n’importe quelle gestion de banque 
ou d'entreprise. Une entreprise qui évalue ses stocks va devoir noter la quantité de liq- 
uidités, de bien immobiliers, de machines, des produits stockés ou fabriqués. Prenons un 
petit exemple : un agriculteur produit des pommes de terre, du tournesol, du fourrage, 
du blé et des olives. Pour noter sa production annuelle (disons en tonnes) il a besoin d’un 
vecteur avec cinq coordonnées p = (%1,...#5). Si la production des mêmes produits par 
un autre agriculteur est p' = (x°,...x£) alors leur production totale sera représentée par 
la somme des deux vecteurs p et p’. Si l’on veut la production en kilo du premier, elle sera 
donnée par le vecteur 1000p — (1000x:1,...1000%;). 

Le bureau des douanes (ministère du commerce extérieur) comptabilise les importa- 
tions/exportations de plusieurs milliers de produits (ayant chacun plusieurs paramètres : 
prix, code du pays, etc). Il est clair que la manipulation de telles données se fait sur 
ordinateur et qu’il y a donc besoin de procédures mathématiques (et de personnel sachant 
les utiliser!). 


Quels sont les problèmes posés qu’on veut résoudre? L’algèbre linéaire est un outil 
précieux pour l’étude de la géométrie. Nous aborderons ceci à partir d'exemples. L’arché- 
type du problème d’algèbre linéaire est un système linéaire : 

Exemple (simple) : 

On dispose d’un budget de 200F pour préparer une sangria en mélangeant deux pro- 
portions de jus de fruit pour une proportion de vin ; sachant que le vin coûte 20F le litre 
et le jus de fruit 10F le litre combien de litres de sangria pourra-t-on préparer? 
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Appelons x le nombre de litres de vin et y le nombre de litres de jus de fruits, le 
problème se traduit par le système d’équations : 


y = 2x 
20x + 10y = 200 


d’où l’on tire aisément 20x + 10(2x) = 200 et donc x = 5 et y — 10. On pourra donc 
préparer 15 litres. 
Un système linéaire général à n inconnues et m équations s’écrit : 


Q&1121 +... + Ginln = b: 


(où les a;; et les b; sont des constantes et les x; sont les inconnues). Si n et m sont 
grands (de l’ordre de quelques milliers par exemple) on ne peut résoudre “à la main” ces 
systèmes et on a développé au chapitre précédent un algorithme pour les traiter. Les 
systèmes linéaires ont tous une structure similaire : si l’on considère le système obtenu en 
remplaçant les b; par 0, qu’on appelle le système linéaire homogène associé : 


1121 +... + Ginln = 0 


on voit que les solutions forment un espace vectoriel contenu dans R” (la définition formelle 
n’est donnée qu’au paragraphe suivant) : la somme de deux solutions est encore une 
solution, le produit par un scalaire d’une solution est encore une solution. De plus si l’on 
connaît une solution particulière du système de départ, toutes les autres sont sommes de 
la solution particulière et d’une solution du système homogène. 

Exemple : une solution du système 


z+y+z=l 
æ—y+2z=0 
JT —y+0z=]l 


est donnée par (2,0, —1) (vérification directe) alors que le système homogène 


x+y+z—0 
x—y+2z=0 
ST — y +9z —=0 


a pour solutions les vecteurs de la forme (—3t,t,2t) avec t € R. Ainsi les solutions du 
système de départ sont toutes données par (—3t + 2,t,2t — 1) quand t varie. 

Ces équations linéaires définissent aussi les objets géométriques simples comme les 
droites, les plans : 

Dans le plan R?, l'équation ax + by = c (où a,b,c sont des constantes) définit une 
droite (sauf si a = b = 0). Dans l’espace R° l'équation ax + by + cz = d (où a, b, c, d sont 
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des constantes) définit un plan (sauf si a = b = c — 0) mais il faut deux équations pour 
définir une droite. Toutefois deux équations linéaires dans R° ne définissent pas toujours 
une droite : par exemple les équations 2x — y +32 = 2, —6x + 3y — 9z — —6 définissent un 
plan. 

8.2 ESPACES VECTORIELS 


Ce paragraphe contient la formalisation de la notion d’espace vectoriel. On ne gagne 
rien à supposer que le corps de base est toujours R, on travaillera donc sur un corps K, 
mais dans les exemples, on pourra supposer K = R. Si le goût du lecteur l’incline vers 
les situations concrètes où le souci du “À quoi ça sert?”, il pourra méditer le fait que la 


théorie des codes de télécommunication utilise largement les espaces vectoriels sur les corps 
finis Z/p2Z. 


Définition: Un espace vectoriel sur un corps K est un ensemble E, muni de deux lois 
(+,.), la loi + étant une application de E x E vers E, la loi . (“multiplication par un 
scalaire”) étant une application K x E vers E, telles que : 

1) (£,+) est un groupe commutatif (avec élément neutre noté 0 ou 0%). 

2)VaeK,zx,yeE a(x+y)=ax+ay 

3) Va,beK,xeE (a+b).x = a.x +b.x 

3)Va,beK,xeE (ab).x = a.(b.x) 

A)VxeE 1x=x 

Convention : On omettra très souvent le point notant la multiplication par un scalaire. 
On dira souvent un K-espace vectoriel au lieu d’un espace vectoriel sur K 

Exemples : on vérifie (immédiatement) que (X”,+,.) (où l’addition et la multiplica- 
tion par un scalaire sont définies comme au paragraphe précédent pour R”) est un espace 
vectoriel. 

- L'ensemble des solutions d’un système linéaire homogène est un espace vectoriel 
(comme c’est un sous-ensemble de K” l’addition et la multiplication par un scalaire sont 
déjà définies). 

- L'ensemble des matrices m x n est un espace vectoriel. 

- Le corps des complexes C est un espace vectoriel de deux façons (au moins) : c’est 
d’abord un espace vectoriel sur lui-même, mais c’est aussi un espace vectoriel sur R. 

- L'espace des fonctions de R dans R est un R-espace vectoriel : si f,g sont des 
fonctions et a un réel, on pose (f + g)(x) := f(x) + g(x) et (af)(x) := af(x). 

- L'espace des fonctions continues de R dans R est un R-espace vectoriel. En effet la 
somme de deux fonctions continues est continue de même que le produit par une constante. 

- L'espace des fonctions f(t) deux fois dérivables de R dans R et vérifiant l’équation 
différentielle : 


f"(E) + cost) f'(t) + 3tf(t) = 0 


est un R-espace vectoriel. En effet la somme de deux fonctions deux fois dérivables 
et vérifiant l’équation différentielle est encore deux fois dérivable et vérifie l’équation 
différentielle (voir le chapitre 20 pour l’utilisation de cet exemple). 

- L'ensemble K[X] des polynômes forme un X-espace vectoriel. 


or 


- L'ensemble des suites u := (u»)hen à valeurs réelles forme un espace vectoriel : si 
U := (Un)nenN et V := (Un)nen sont des suites et & un réel, on pose u + v := (un + Un)neN 
et au := (Qüun)neN 

- L'ensemble des suites réelles u := (uy)nen vérifiant la relation de récurrence : 


Un + (2n + 1jun_1 + n?un_9 = 0 


forme un espace vectoriel. En effet la somme de deux telles suites et le produit par une 
constante est encore une suite du même type (voir le chapitre 12 pour l’utilisation de cet 
exemple). 


On peut aussi à partir d'espaces vectoriels donnés en fabriquer d’autres. 


Définition: Un sous-ensemble F d’un espace vectoriel E est un sous-espaces vectoriel 
si muni des deux lois de Æ (restreintes à F) il devient un espace vectoriel. 


Cela signifie donc que la loi d’addition est une loi interne de F x F dans F', que pour 
tout }eERet x € Fona Àx € F'et que F muni de ces deux opérations vérifie les axiomes 
d’un espace vectoriel. 


PROPOSITION: Soit F CE, alors F est un sous-espace vectoriel de E si et seulement 
si On à : 

(i) O£€EF 

(ü) Va,BE K, Va,yeF, ax+byerF 


Démonstration: En effet cette condition équivaut au fait que l’addition et la multipli- 
cation par un scalaire (dans Æ) définissent bien deux lois FxXF-FetKxF—Fet 
les axiomes d’espace vectoriel sont alors vérifiés puisqu'ils le sont dans £. D 


Exemples : Une droite passant par l’origine, un plan passant par l’origine sont des 
sous-espaces vectoriels de R°. Si x € E (et x Z 0) alors l’ensemble des vecteurs ax (où a 
parcourt À) est un sous-espace vectoriel : c’est “la droite engendrée par +”. 


Comme application, on peut observer que l’intersection de deux sous-espaces vectoriels 
est encore un sous-espace vectoriel mais que l’union n’est pas un sous-espace vectoriel (sauf 
si l’un des deux espaces contient l’autre). 

Si F,F' sont des sous-espaces vectoriels de E on peut définir leur somme comme : 


F+F':={f+f |feFretf'er} 


On dira que les deux sous-espaces vectoriels sont en somme directe si F NF" = {0} et on 
notera, dans ce cas la somme F @ F". 

Si S est un sous-ensemble de Æ, on peut définir l’espace vectoriel engendré par S 
comme la somme des droites engendrées par les éléments de S. Par exemple si e := (1,0,0), 
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f := (0,1,0), g := (1,1,0) et À := (0,0,1) € R* alors l’espace vectoriel engendré par 
{e, f,g} est un plan alors que l’espace vectoriel engendré par {e, f,h} est l’espace R* tout 
entier. Les sous espaces engendrés par {e, f} et par {f,g} ne sont pas en somme directe 
mais les sous espaces engendrés par {e, f} et par {h} sont en somme directe. 


Notation : Soit e1,...,e, des vecteurs d’un espace vectoriel E. L'ensemble des combi- 
naisons linéaires des e1,...,e, est un sous-espace vectoriel de Æ, on le note : 


Vect(e1,...,er) = {x = Àie1 +... + rer | A1,...,X CR} 


Si E,F sont des espaces vectoriels, on peut définir de manière naturelle une structure 
d'espaces vectoriel sur le produit : 


Va,z'eE,yy er: (a,y)+(x,y):=(r+z,y+y) et a(x,y):= (ax, ay) 
Par exemple Rx R’ s’identifie à R777, 
8.3 BASES ET DIMENSION 


Dans tout ce paragraphe on travaille dans un espace vectoriel E sur un corps K° que 
l’on pourra prendre égal à R. Ce paragraphe donne une définition précise de la notion de 
dimension d’un espace vectoriel et est fondamental pour la suite. Le point clef est qu’un 
espace vectoriel E (de dimension finie) est toujours isomorphe à K” et plus précisément 
qu'il existe n vecteurs e1,...,e, tels que tout vecteur de E s’écrivent de façon unique 
comme combinaison linéaire des e;. Ceci généralise la notion de repère du plan (deux 
vecteurs) et de l’espace (trois vecteurs). 


Commençons par un peu de vocabulaire : 

Une famille de vecteurs est une suite (finie dans la pratique) de vecteurs indexés par 
un ensemble 7 (dans la pratique on prend souvent I := {1,...,n}) ; on note (e;);er une 
telle famille. 

Une combinaison linéaire des vecteurs e; est un vecteur x de la forme x := D. ie; 
avec à; € K ; si l’ensemble J est infini on impose que pour tout à € 1, sauf un nombre fini, 
on ait a; = (. 


Définition: 1) Une famille (e;);er de vecteurs est libre si la seule combinaison linéaire 
nulle des e; est obtenue en prenant tous les à; nuls ; elle est liée si elle n’est pas libre. 

2) Une famille (e;);er de vecteurs est génératrice de l’espace vectoriel Æ si tout vecteur 
de Æ est une combinaison linéaire des e;. 

3) Une famille (e;);er est une base si elle est libre et génératrice. 


Exemples : 1) Une famille contenant le vecteur nul 0 ou bien contenant deux vecteurs 
égaux est liée. Plus généralement une famille est liée si et seulement l’un de ses vecteurs 
est combinaison linéaire des autres vecteurs. 


2) Prenons E := R* et 


2 0 2 1 
e1:= | 2 |, e2 := 1 , e3:= | —1 | ,e4:= {0 
2 —] 5 2 


On vérifie les relations : e3 = e1 — 3e2 et 264 = e2 + e3 ainsi la famille {e1,e2,e3,e4} n’est 
pas libre, la famille {e:,e2,e3} non plus. Par contre la famille {e:,e2} est libre ; en effet 
si @1e1 + Q2e2 = 0 alors à = à + à2 = 2a1 — àa2 = 0 ce qui entraîne a = a2 = 0. 
Géométriquement cela traduit que les deux vecteurs e1,e2 ne sont pas situés sur une même 
droite : ils ne sont pas colinéaires ; par contre les quatre vecteurs e1,e2,e3,e4 sont tous 
situés dans un même plan P. On peut d’ailleurs vérifier que ce plan est donné par : 


T1 
a — T1 ER°| 2%; +%+73=0 
T2 
1 
Considérons maintenant le vecteur e5 := | 0 | et vérifions que {e1,e2,e5} forme une base 
0 


de E = R°. Tout d’abord prouvons que cette partie est libre : pour cela on considère 

une combinaison linéaire nulle : a1e1 + àa2e2 + ages = 0 ; ceci équivaut à : 2a1 + a3 = 

0,2a1 +a2 = 0 et das — a2 = 0 ; en sommant les deux dernières égalités on obtient 3a1 = 0 

donc a; = 0 puis @2 = «3 = 0. Pour montrer (directement) que {e1,e2,e5} est génératrice 
a 

on doit montrer que pour tout vecteur e := | b | il existe une combinaison linéaire telle 
€ 

que e = a1e1 + ae + ases. Ceci équivaut à à1 + a3 = àa,@1 + @2 = b, 2a1 — 2 = c dont 

on détermine l’unique solution a3 = (3a — b — c)/3, a2 = (2b — c)/3 et a1 = (b+c)/3. 


3) (Base canonique) Il est facile de vérifier que dans K”, les vecteurs e1 := (1,0,...,0), 
e := (0,1,0,...,0), ...,en := (0,...,0,1) forment une base : en effet tout vecteur x — 
(t1,...,2n) s'écrit de manière unique comme combinaison linéaire des e; de la façon suiv- 


ante : &æ = %1€1 +... +Znen. Cette base s’appelle la base canonique de K”. 


Commentaires : On voit que si l’on considère une famille finie {e1,...,e,} et si l’on 
examine les combinaisons linéaires de ces vecteurs : 


1) Si la famille est libre, un vecteur, qui est combinaison linéaire, l’est de manière 
unique. 


2) Si la famille est génératrice, tout vecteur est combinaison linéaire des vecteurs de 
cette famille, autrement dit Vect(e:,...,e,) est l’espace tout entier. 


3) Si la famille est une base, tout vecteur s’écrit de manière unique comme combinaison 
linéaire. En d’autres termes l’application de K” vers E donnée par (@1,...,a») - aie1 + 
... + Anen est une bijection. 


Nous dirons (provisoirement) qu’un espace vectoriel E est de dimension finie si il 
admet une famille génératrice finie. 


Exemple : L'espace vectoriel K[X] n’est pas de dimension finie sur K. En effet si 
P:,...,P, est une famille finie de polynômes, soit d := max(deg(P;)), alors toute combi- 
naison linéaire des P; est un polynôme de degré inférieur ou égal à d. 
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L'espace vectoriel K7 est de dimension finie (heureusement ...) puisque les vecteurs 
ei := (0,...,1,...,0) (avec un 1 sur la i-ème coordonnée) forment une base. Nous allons 
maintenant voir que tout espace vectoriel de dimension fini est en fait de ce type. 


PROPOSITION: Soient e1,...,e, des vecteurs de E, soient f1,...,fn+1 des combi- 


naisons linéaires des e1,...,e,, alors la famille des f; est liée. 

» . Q _« n+1 y ” ï . Q 
Démonstration:  Ecrivons f; = ';aije;, alors » 7,75 æifi = 37; (D ;aijti)e; mais on 
sait que le système Ÿ'; a;;x; = 0 pour j = 1,...,n possède une solution non nulle car c’est 


un système homogène avec plus d’inconnues que d'équations (la démonstration de ce fait 
a été donnée en étudiant la méthode du pivot au chapitre 7) : donc celle-ci fournit une 
combinaison linéaire des f,; qui est nulle. Ü 


COROLLAIRE: Deux bases ont toujours le même cardinal. 


Démonstration: Soient e1,...,€n et f1,..., fm deux bases. Si on avait m > n, comme 
les f; sont des combinaisons linéaires des e;, on en tirerait que les f; sont liés, ce qui n’est 
pas. On a donc établi que m < n et par symétrie n < m et doncm=n. TO 


Remarque : le corollaire reste vrai si l’espaces est de dimension infinie, mais la preuve 
est plus difficile. 


THÉORÈME: (de la base incomplète) Soit £ une partie libre de E contenue dans G 
une partie génératrice de E. Alors il existe une base B de E contenant £L et contenue dans 


G. 


Le nom du théorème provient du fait qu'il indique que l’on peut compléter la partie 
libre £ en une base (à l’aide d'éléments d’une partie génératrice). On pourrait aussi 
l’appeler “théorème de la base extraite” puisqu'il dit aussi que l’on peut extraire une base 
de toute partie génératrice. 


Démonstration: Choisissons un sous-ensemble {b1,b2,...} — B de G donnant une 
partie libre, contenant £ et de cardinal maximal pour ces propriétés ; montrons que c’est 
bien une base. Il suffit de voir que c’est une partie génératrice ; mais comme tout vecteur 
est combinaison linéaire des éléments de G, il suffit de voir qu’un vecteur de G est une 
combinaison linéaire des vecteurs de B. Soit donc e un vecteur de G alors la famille BU{e} 
est liée et la relation de dépendance linéaire Be + ŸS' a;b; — 0 ne peut pas correspondre 
à 5 = 0 (sinon les b; € B seraient liés) et permet donc d’exprimer e comme combinaison 
linéaire des vecteurs de B. 


On en déduit immédiatement : 
COROLLAIRE: Tout espace vectoriel de dimension finie admet une base (finie). 


Démonstration: On prend une partie génératrice finie et on peut en extraire une 
base. [I 


Toutes les bases ayant même cardinal, on peut définir : 


Définition: Le cardinal d’une base de ÆE s'appelle la dimension de E. On le note 
dim(E). 
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Définition: La dimension de l’espace vectoriel engendré par un système de vecteurs 
{u; | à € I} s'appelle le rang du système. En d’autres termes le rang de {u; | à € I} est 
dim Vect(u, | 1 € Î). 


Ainsi un espace est de dimension n si l’une de ses bases (et donc toutes) est de cardinal 
n. La dimension est l’invariant le plus important d’un espace vectoriel. L'espace K7 à une 
base de cardinal n et est donc bien de dimension n (ouf!) et en fait si Æ est de dimension 
n sur K et a pour base e1,...,e,, l'application (a1,...,a») — aie1 +... + ane, est 
une bijection (et même un isomorphisme dès que nous aurons vu la notion d’application 
linéaire). 


COROLLAIRE: Soit F un sous-espace vectoriel de E espace vectoriel de dimension 
finie, alors il existe un autre sous-espace vectoriel F” tel que E = F & F'. On dit que F" 
est un supplémentaire de F dans E. 


Démonstration: On choisit une base de F, disons e1,...,en que l’on complète en une 
base de E, disons e1,...,en ; alors le sous-espace vectoriel F” engendré par em11,...,€n 
répond à la question. D 


Un supplémentaire n’est pas unique ; un décompte des cardinaux des diverses bases 
montre que la dimension du supplémentaire est indépendante du choix du supplémentaire 
et vaut dim(ÆE) — dim(F). 


COROLLAIRE: Supposons que E est de dimension n alors : 

1) Toute famille libre est de cardinal au plus n (avec égalité si et seulement si c'est 
une base). 

2) Toute famille génératrice est de cardinal au moins n (avec égalité si et seulement 
si c’est une base). 


Démonstration: 1) Une partie libre peut être complétée en une base de cardinal n et a 
donc un cardinal < n avec égalité si il n’y a pas besoin de compléter, ï.e. si c’est une base. 

2) Si une partie est génératrice, on peut trouver un sous-ensemble qui est une base 
de cardinal n, donc le cardinal est au moins n avec égalité si la partie génératrice est une 
base. D 


En particulier, dans un espace de dimension n, le rang d’un système u1,...,um est 
toujours inférieur ou égal à min(m, n), il est égal à m si et seulement si le système est libre 
et il est égal à n si et seulement si le système est générateur. 


COROLLAIRE: 1)SiF C E alors dimF < dimÆ, avec égalité si et seulement si 
E = F. 

2) dim(E@& F) = dimE +dimF 

3) dim(E x F) = dimE +dimF 
Démonstration: Ces trois énoncés peuvent se démontrer en dénombrant des bases de 
chacun des espaces vectoriels. Aïnsi pour 1) on complète une base e1,...,e, de F en une 


base e1,...,e, de E et bien sûr m < n, l'égalité ayant lieu si E = F. Pour 2) on constate 
que l’union d’une base de Æ et d’une base de F est disjointe et donne une base de E@F. 
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Pour 3) on observe que si e1,...,em est une base de E et f1,...,/f, est une base de F 
alors (e1,0),...,(em;0), (0, f1),...,(0, fn) fournit une base de E x F.0 


Descartes René (1596-1650) 
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CHAPITRE 9 APPLICATIONS LINÉAIRES 


On formalise dans ce chapitre le deuxième concept abstrait fondamental en algèbre 
linéaire : celui d'application linéaire ; le lecteur connaît déjà un bon nombre d’exemples : 
hormis les applications définies par des matrices, on étudie au lycée des rotations, symé- 
tries, projections, homothéties que l’on retrouve ici. 


9.1 THÉORÈME DE LA DIMENSION 


Définition: Soient E,F des K-espaces vectoriels, une application u : E — Fest 
K-linéaire (ou linéaire si le contexte est clair) si elle vérifie : 


Vei,e € E, Va,a2 € K, u(aie1 + a2e2) = œu(e1) + azu(e2) 


Exemple : si £ = K" et F = K7 alors toute matrice À m x n définit une application 
X — AX (où X est un vecteur colonne) de Æ vers F qui est linéaire puisque A(a1X1 + 
a2X5) = a AX; + a2AX. 

On utilise fréquemment la linéarité de la dérivation, de l’intégrale ; traduit en termes 
d'espaces vectoriels cela signifie que, par exemple l’application f + f’ qui a une fonction 
associe sa dérivée est linéaire (de l’espace des fonctions dérivables dans l’espace des fonc- 
tions), que l'application f + fo f(t)dt est linéaire (de l’espace des fonctions continues dans 
R disons). Voyons comment u agit sur les sous-espaces vectoriels : 


PROPOSITION: Soient E,F des K-espaces vectoriels et u une application linéaire 
de E vers F, l’image d’un sous-espace vectoriel de E par u est un sous-espace vectoriel de 
F, l’image réciproque d’un sous-espace vectoriel de F par u est un sous-espace vectoriel 
de E. 


Démonstration: Soit E” un sous-espace vectoriel de ÆE, soient y1,y2 € u(E”) alors il 
existe 21,22 € E” tels que y; = u(x;) donc @iy1 + aoyo = u(a1T1 + a2t2) E U(E") ; donc 
u(E") est un sous-espace vectoriel. Par ailleurs si Æ” est un sous-espace vectoriel de F et 
si 1,22 Eu !(F") alors u(a1x71 + a2t2) = aœyu(r1) + aou(x2) € F' donc a171 + ar € 
u-1(F") et u!(F") est bien un sous-espace vectoriel. CO 


En particulier le noyau de u, l’ensemble Ker(u) := {x € E | u(x) = 0} est un sous- 
espace vectoriel de E et l’image de E par u, l’ensemble Im(u) := {y € F|x€ E, u(x) = 
y} est un sous-espace vectoriel de F. On vérifie aisément que : 

- Une application linéaire u est injective si et seulement si son noyau est nul : Ker(u) — 
{0} 

- Une application linéaire uw est surjective si et seulement si l’image d’une partie 
génératrice est génératrice. 


Définition: Un isomorphisme d'espaces vectoriels est une application linéaire u : E — F 
qui est bijective. 


Remarque : il est immédiat que si u est bijective et linéaire, la bijection réciproque 
est aussi linéaire et que u transforme une base de E en une base de F. 
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Exemples : Soit u(x,y) := 2x + y de R? vers R alors le noyau est la droite donnée 
par l’équation 2x + y = 0 et l’image est R entier. 


Soit v(x,y, 2) = (2x + y, 3y +2,2+y+x,x +y) de R° dans R, alors un petit calcul 
fournit que Ker(v) = {0} et que l’image est l’hyperplan d’équation —3X —Y +Z+5T = 0. 

Une rotation, une symétrie, une homothétie de rapport non nul est bijective (noyau 
nul et image égale à l’espace entier). Une projection se fait parallèlement à son noyau et 
sur son image. 


Rotation dans le plan Rotation dans l’espace 
Symétrie dans le plan Symétrie dans l’espace 
Projection sur une droite Projection sur un plan 
parallèlement à un plan parallèlement à une droite 


Les rotations et les symétries sont des isomorphismes alors que les projections ne sont 
pas surjectives et ont un noyau non nul. On peut observer sur ces exemples la loi générale 
sur les dimensions que l’on énonce maintenant : 


THÉORÈME: Soient E , F des K-espaces vectoriels et u une application linéaire deE 
vers F, alors 
dim Æ = dim Im(u) + dim Ker(u) 


Démonstration: Soit E’ un supplémentaire de Ker(u) (i.e. E’ & Ker(u) = E) alors la 
restriction de u à E” avec pour but F’ := Im(u) est un isomorphisme u’ : E’ — F' : en effet 
elle est surjective car si y € F’ alors il existe x € E tel que u(x) = y mais x = x’ + x” avec 
x'e E' et x” € Ker(u) donc y = u(x) = w’(x') ; par ailleurs Ker(u’) = Ker(u) NE’ = {0} 
donc u’ est injective. On a donc dim ÆE’ = dim Im(u) et dim Ker(u) + dim E’ = dim E d’où 
le théorème. 
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COROLLAIRE: dimu(E) < dimE (avec égalité si et seulement si u est injective). 


Démonstration: En effet dimu(E) = dim E — dimKer(u) < dim £ avec égalité si et 
seulement si Ker(u) est nul c’est-à-dire si u est injective. OC 


COROLLAIRE: Soient E,F des K-espaces vectoriels et u une application linéaire de 
E vers F', supposons dim E = dim F = n, alors u est bijective si et seulement si elle est 
injective ou bien si et seulement si elle est surjective. 


Démonstration:  L’application u est surjective si et seulement si dim Im(u) — n donc 
si et seulement si dim Ker(u) — 0 c’est-à-dire si uw est injective. D 


COROLLAIRE: Soient E et F des sous-espaces vectoriels d’un espace vectoriel G. 


dimE + dimF = dim(E +F)+dim(EnF) 


Démonstration: Considérons l’application linéaire u : E x F — E + F donnée par 
(x, y) + x +4y. Elle est surjective par construction et son noyau est le sous-espace vectoriel 
{(&Y)EE XF |x+y=0} = {(x,-x) | x € ENF} qui est isomorphe à ENF. On en 
déduit que dim E + dimF = dimE x F = dim(E +F)+dim(ENnF).0 


9.2 MATRICE D'UNE APPLICATION LINÉAIRE 


Un moyen simple de construire des applications linéaires est de fixer l’image des 
éléments d’une base de l’espace de départ u(e:),...,u(eh). Si l’on dispose d’une base 
de l’espace d’arrivée on peut exprimer les vecteur u(e;) comme combinaisons linéaires des 
vecteurs de la base. On arrive à une description de u par un ensemble de nombres qui se 
range naturellement dans un tableau, i.e. une matrice. Cette construction est l’inverse de 
celle qui a une matrice À associe l’applicaton linéaire X - AX et est extrêmement utile 
pour l'étude des applications linéaires et des matrices. 


Définition: Soient e1,...,e, une base de E et f1,..., fn une base de Fetu:E—F 
une application linéaire, alors u(e;) := @15f1 +... + @mjfm et on définit la matrice de u 
dans les bases e = e1,...,en, f = f1,..., fm Comme : 


Mat(u; (e),(f)) := (ai;) 


Cette correspondance entre matrices et application linéaire est si naturelle que la compo- 
sition d'application linéaires correspond à la multiplication des matrices : 


THÉORÈME: Soient e1,...,€n une base de E, f1,..., fm une base de F et g1,...gk 
une base de G, soientu:E — Fetv:F— G des applications linéaires, alors 


Mat(v o u; (e),(g)) = Mat(v; (f), (g))Mat(u:; (e), (f)) 
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Démonstration: Notons B := Mat(v;(f),(g)) = (bi;) c’est-à-dire v(f;) = se b;ÿgi 
et À := Mat(u;(e),(f)) = a&; c’est-à-dire u(e;) = 377, ai;f; et enfin BA = (c;;) donc 
Cij = D y binanj. On peut calculer : 


m m k k m 
voule;) =v os 71) — + Ghj 5 bn) = D bn) gi 
h=1 h=1 i=1 i=1 \h=1 


Remarque : soit e1,...,en la base canonique de R? et f1,...,/f" la base canonique 
de R’”? alors les vecteurs colonnes de la matrice de u : R" — R"? sont les vecteurs 
u(e1),...,u(eh). 


Exemples : (on choisit la base canonique de R? dans les exemples qui suivent) 


cos(#) —sin(8) ) En 


La matrice d’une rotation uw d’angle Ô est donnée par Ro — En cos(8) 


et ue) = (0) ] etutes) = (5) 


La matrice de la symétrie par rapport à la droite faisant un angle 0/2 avec l’axe des x 
| cos(0)  sin() __ f cos(é) __{ sin(6) 
est donnée par : Zcoë(O) En effet u(e1) = sn(0) et u(e2) = | cos (O) 


ue . , I 
La matrice de la projection sur l’axe des x parallèlement à l’axe des y est È . 


La matrice d’une homothétie de rapport a est é a 


APPLICATION: Formules d’addition de cosinus et sinus : 


En appliquant le théorème précédent à la composition de deux rotations d’angles 0 et 
0" on obtient Rg:9 — RaRor et donc : 


et Lo oo de 


: eo cos(@”) — sin(@)sin(9’) — cos(4) sin(9”) — cos(4") sin(8) ) 
cos(8) sin(4’) + cos(9’)sin(4)  cos(4) cos(0’) — sin(4) sin(0/) 
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ce qui donne bien les formules d’addition de cosinus et sinus : 


cos(0 + 0") = cos(8) cos(4") — sin(0) sin(9’) et sin(9 + 0’) = cos(4) sin(9/) + cos(9”) sin(6) 


9.3 CHANGEMENTS DE BASES 


Reprenons l'exemple de la symétrie par rapport à une droite dont la matrice dans 
cos(0)  sin(0) 
sin(#) —cos(ô) 


la base canonique est ( ) : si l’on choisit comme base les vecteurs f1, fa 


comme indiqué ci-dessous on obtient comme matrice pour la symétrie LU Li 


On se propose dans ce paragraphe de systématiser les calculs de ces changements 
de base. Le but est le plus souvent de trouver des bases dans lesquelles la matrice de 
l’application étudiée est la plus simple possible. 


Définition: Soient e1,...,e, et e,,...,e!, deux bases de E, la matrice de passage de e 
à e’ est la matrice n x n dont la j-ème colonne est formée des composantes de € dans la 
base e1,...,en. 

En d’autres termes P(e,e') = (a;;) avec e; = Yi; aijes. 


Commentaires : 1) La matrice P = P(e,e') est aussi Mat(id, (e'),(e)) la matrice de 


! 


l’application identité de E (muni de la base e!,...,e!,) vers E (muni de la base e1,...,e»). 


2) Si on pose P' = P(e!,e) alors PP! = Id ou encore P! = P(e/,e). 
3) Le sens d'écriture est bien sûr une convention ; l’important est d’être cohérent (on 
roule à gauche en Angleterre). 


THÉORÈME: Soit u : E — F une application linéaire et soient e1,...,en, e,,...,e! 


1n 
deux bases de E et f1,..., fin, f1,-..,f}, deux bases de F ; notons À la matrice de u dans 


les bases e et f et À’ la matrice de u dans les bases e' et f" ; notons encore P = P(e,e!) 
et Q = P(f, f') les matrices de passage de e vers e’ (resp. de f vers f’), alors : 


A'=Q AP 


Démonstration: Considérons la suite d'applications : 
r ide u id ! 
(EEE RCE) REP ET) 
On peut en déduire l’égalité de matrices : 
Mat(u, (e”),(f)) = Mat(ide, (f), (f))Mat(u, (e),(f))Mat(idr, (e’), (e)) 
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ce qui correspond bien à l'égalité 4 = Q=-!AP. O 


Exemples : 
1) Considérons l'application linéaire u de R? dans R? dont la matrice dans la base 
; = 2 1 . 
canonique €1,e2 est É et choisissons €! :— (:) et es := 1) La matrice 
de passage de e vers e/ est P — : ' et son inverse se calcule facilement P-1 — 


oo. . Par ailleurs u(e!) = e! et u(e,) = 2e, donc la matrice de w dans la base e! 
1 =) 1 1 2 2 


est È à : on vérifiera qu’on a bien 


(sr (s 9) 


2) Soit u : E — F', on peut choisir des bases “bien adaptées” à uw ainsi : pour E on 


choisit e1,...,e, de sorte que e;+1,...,eh forment une base du noyau de u et e1,...,e 
forment une base d’un supplémentaire du noyau. Les vecteurs f1 = u(e1),...,f, — u(e;) 
sont linéairement indépendants et on peut les compléter en une base f1,..., fm de F ; la 
matrice de u s'écrit alors : 

1 0 

0 . 

Mattui(eo,(D)= | 0 1 a 
0 O0 
0 0 
0 0 


En particulier on voit que pour toute matrice À il existe P, Q inversibles telles que Q=!AP 
soit de la forme précédente. L’entier r est le rang de la matrice ou de l’application linéaire, 
c’est-à-dire la dimension de l’image. 3) Soit e1, e2, e3 la base canonique de R° et soit u la 
rotation d’angle 27/3 d’axe e1 +e2 +e3. Choisissons f3 = 7 (ei + e2 + e3) et ensuite f1, 
f2 formant une base orthonormé du plan orthogonal à f3 de sorte que f1, f2, f3 forment 


une base directe de l’espace. Pour fixer les idées on peut prendre f; = 73 (e1 — e2) et 


f2 = 7x (e1 + e2 — 263). Alors 


cos(27/3) —sin(27/3) 0 ! =y3 0 
Mat(u;(f)) = | sin(2r/3)  cos(2r7/3) 0 | — e = 0 
0 0 if 0 0 1 
v2 V6 V3 
2 6 3 
et, en posant P := P(e, f) = 2 V6 V3 , on obtient 
0 =v6 va 
3 3 
cos(27/3) —sin(2r/3) 0 0 0 1 
Mat(u; (e)) = P | sin(2r/3)  cos(2r/3) O0|P-!=|1 0 0 
0 0 1 6 CAS 
(exercice : vérifier que u est une isométrie du cube € := [-1,1]?). 


89 


CHAPITRE 10 INTRODUCTION AUX DÉTERMINANTS 


On définit et étudie dans ce chapitre le déterminant de n vecteurs e1,...,e, dans 
R’ ; c’est un nombre réel {ou un élément de K si on travaille dans K”). L'interprétation 
géométrique de la valeur absolue de ce déterminant est simple et importante : c’est le 
“volume” du parallélipipède engendré par les vecteurs e1,...,e» : 


Dans R?, on a | det(e,e2)| = aire hachurée 


Dans R°, on a |det(e1,e2,e3)| = volume du parallélipipède 


Avec cette interprétation, il est clair que le déterminant s’annule si et seulement si 
le parallélipipède est “plat”, c’est-à-dire si les vecteurs e1,...,e, sont liés. Le signe du 
déterminant est plus subtil et correspond à l’orientation de l’espace, concept que nous 
n'élaborerons pas (voir néanmoins le chapitre suivant) ; voici le signe sur des exemples : 


Les déterminants fournissent également un critère théorique (et parfois pratique) pour 
calculer le rang d’une matrice et résoudre certains systèmes linéaires ; c’est l’application 
qui est exposée ici. La construction du déterminant est assez abstraite et pourra être 
survolée en première lecture. 


10.1 FORMES n-LINÉAIRES ALTERNÉES 


Définition: Soit E un K-espace vectoriel et n > 1, une application f:ExX...xE — K 
est n-linéaire si elle est linéaire par rapport à chaque variable, c’est-à-dire si : 
f(x, es Det Tes a) = a f(x1, DT Vis DT 0 à ,Tn)+ 
Bf(x1, ces Lis Zi Lit... 5%) 

Elle est symétrique si elle est invariante par permutation des facteurs et antisymétrique 
ou alternée si l’interversion de deux facteurs change le signe, c’est-à-dire si 


NT ÉlNEEN ne rss tie een en) 
Remarque : on déduit immédiatement que si f est alternée, alors f(...,x,...,æ,...) — 
0 et puis plus généralement que si x; est une combinaison linéaire des autres vecteurs 
du ie bn Ho fl...) = 0 
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Exemples : Le produit scalaire Rx R? — R est bilinéaire et symétrique. L’applica- 
tion de R? x R? vers R définie par ((a,b),(c, d)) ad — bc est bilinéaire alternée. 
Il y a assez peu de formes alternées comme le prouve l’énoncé suivant : 


PROPOSITION: Si dim(ÆE) = n, l’ensemble des formes n-linéaires alternées est un 
espace vectoriel de dimension 1. Si e:,...,e, forment une base de E et si f est une forme 
n-linéaire alternée non nulle, alors f(e1,...,e») # 0. 


Démonstration: (la démonstration n’est compliquée que par les notations) Soient 

æ1,...,2n des vecteurs de Æ ; écrivons leurs coordonnées dans la base e1,...,e, ainsi : 
102 

Ti =); aie; et donc 


Fri) >» (TI) flenseiuse) 


fin Vi=l 
mais f(e;,,...,e,;,) = 0 si l’un des j; apparaît deux fois et si les j;, sont une permutation 
de 1,2,...n alors f(e;,,...,e,,) = Ef(e1,...,e,) où € est le signe de la permutation en 


question. En définitive on obtient, en changeant un peu les notations : 


Tres o E(s) [Tu )) Flénses36s) 


8ESn 


On voit donc que toutes les formes n-linéaires alternées sont proportionnelles et que f est 
non nulle si et seulement si f(e1,...,en) £0. D 


Exemple : Si f est n-linéaire alternée sur R”, on peut calculer explicitement : 

Sin = 2: 
F((a,b),(c,d) = acf((1,0),(1,0))+adf((1,0), (0, 1))+cbf((01,), (1, 0))+bdf((0, 1), (0,1)) — 
(ad x bc) f((1, 0), (0, 1)) 


Si n = 3, on vérifiera par un calcul similaire la “règle de Sarrus” : 
f((a, b, és (d, €; fi): (g, h, i)) on (aei+bfg+cdh—afh—bdi-ceg)f((1, 0, 0), (0, 1; 0), (0, 0, 1)) 


On définit maintenant le déterminant de n vecteurs dans un espace de dimension n. 


Définition: Soite:,...,e, une base de FE, le déterminant par rapport à la base e1,...,en 
est l’unique application n-linéaire alternée det : E° — K telle que det(e,...,en) = 1. 


Exemple : Si E — K” on sous-entend que l’on a choisi comme base la base canonique. 
On obtient alors (en écrivant les vecteurs en colonnes) : 


(().(5)}-us 


a d g 
det bl,lel,lh — aei+bfg + cdh — afh — bdi — ceg 
C £ i 
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La propriété fondamentale du déterminant est la suivante : 


THÉORÈME: Le déterminant de n vecteurs æZ1,...,2n dans K°' est nul si et seulement 
si ces vecteurs sont liés. 


Démonstration: On a déjà vu que si les vecteurs sont liés le déterminant est nul ; 
inversement si les vecteurs æ1,...,x, sont libres, ils forment une base (puisque X” est de 
dimension n) et donc, d’après la proposition précédente, det(x1,...,2,) £Z0,. D 


Avant défini le déterminant de n vecteurs de K”, on peut facilement définir le déterminant 
d’une matrice carrée : 


Définition: Le déterminant d’une matrice carrée est le déterminant de ses vecteurs 
colonnes par rapport à la base canonique de K7. 
Le théorème précédent se traduit alors ainsi pour les matrices : 


THÉORÈME: Soit À une matrice carrée, alors À est inversible si et seulement si 


det(A) £ 0. 


Démonstration: D’après le théorème précédent, le déterminant de À est non nul si et 
seulement si les vecteurs colonnes de la matrice À sont linéairement indépendants. Comme 
les vecteurs colonnes de la matrice À engendre l’image de l’application associée à À, cela 
équivaut à dire que cette application est surjective ou encore qu’elle bijective, ce qui signifie 
bien que À est inversible. 


THÉORÈME: Le déterminant des matrices est multiplicatif, c’est-à-dire : si À et B 
sont deux matrices carrées de même ordre n, on a : 


det(AB) = det(A) det(B) 


Démonstration: Soient æ1,...,æn des vecteurs de K”, les applications n-linéaires 
alternées de K° x ... x K° vers K définies par (x1,...,%n) — det(Ax1,...,Ax,) et 
(t1,...,%n) + det(x1,...,%A) sont proportionnelles d’après la première proposition de ce 
chapitre, donc det(Ax:,..., Ax,) = a det(x1,...,1,). En appliquant ceci aux vecteurs de 
la base canonique on obtient que à = det(A) et ainsi : 


det(Ax1,..., Ath) = det(A) det(x1,...,%n) 
Maintenant on peut calculer : 


det(AB) det(x1,...,2») =det(ABx:,...,ABx;) 
= det(A) det(Bx1,...,Bx,) 
— det(A) det(B) det(x1,...,æ») 


d’où la formule det(AB) = det(A) det(B), puisque det(x1,...,2») Æf 0. O 
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Les déterminants peuvent servir à calculer le rang d’une matrice de taille quelconque : 
le point est que l’on peut extraire d’une matrice des matrices carrées en ne gardant que 
les coefficients correspondant à certaines lignes et colonnes. 


Définition: Soit r < min(m,n), on appelle mineurs d’ordre r d’une matrice m x n les 
déterminants d’une matrice extraite de taille r x r. 


Exemples : Les mineurs d'ordre 1 sont simplement les coefficients de la matrice ; les 


mineurs d’ordre 2 d’une matrice À = (a;;) sont les expressions M; ;;:K1 = @ikäjr — @jk@i ; 
11:25 <û 
: ; : . 0 1 2 3 ; 
quelques mineurs d'ordre trois de la matrice À :— DE sont donnés par 
SRE SC 
1 3 0 1 2 3 1 2 0 
det | 1 1 4}]—46, det | O0 1 2 |—0, det| O0 1 3 | —=10 
5 3 1 1 1 1 5 4 1 


THÉORÈME: Soit À une matrice m X n alors Rang(A) = r si et seulement si : 
i) On peut extraire un mineur non nul d'ordre r de la matrice À. 
ii) Tous les mineurs de À d'ordre r + 1 sont nuls. 


Démonstration: Si un mineur d'ordre r est non nul, alors il y a r vecteurs colonnes 
indépendants donc le rang est au moins r. Inversement pour prouver qu’une matrice de 
rang r contient un mineur d'ordre r, il est plus simple d’utiliser que le rang ainsi que 
l'existence d’un mineur de taille donnée non nul ne change pas par opérations élémentaires 
sur les lignes où les colonnes. On est amené alors à prouver l’énoncé pour les matrices de 


la forme Ô 1 ce qui est immédiat. © 


Exemple : Le déterminant de la matrice À de taille 4 x 4 donnée ci-devant est nul et 
l’un (au moins) de ses mineurs d'ordre 3 est non nul, par conséquent cette matrice est de 
rang 3. 


Donnons maintenant une des applications classiques des déterminants aux systèmes 
linéaires. 


THÉORÈME: (Systèmes de Cramer) Considérons un système linéaire carré : 


Q&112X1 +... + Ginln = b: 


dont la matrice associée est inversible ; alors il a pour unique solution 


@11 .. b: ... Ain 
det 
= An1 rêve bn .<.. Ain 
° a11 Sa @ii ... Ain 
det 
An1 +++ ni ::. Ain 
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Démonstration:  Appelons C1,...,C, les vecteurs colonnes de la matrice associée au 
système linéaire et b le vecteur colonne de coordonnées b; ; alors le système se traduit 
par D_%:0; = b donc det(C1,...,b,...,Cn) = xidet(C1,...,C,...,Cn). On obtient 
l’énoncé annoncé en divisant par det(C1,...,C;,...,C»). 0 


10.2 CALCULS DE DÉTERMINANTS 


Les théorèmes précédents ont motivé, nous l’espérons, l’apprentissage de quelques 
techniques de calcul de déterminant. 


Remarque : D’après la propriété de multilinéarité du déterminant, les opérations 
élémentaires modifient de la façon suivante le déterminant : 

— Remplacer une colonne C; par C; + aC; ne modifie pas le déterminant. 

— Inverser deux colonnes ne change pas la valeur absolue, mais change le signe. 

— Multiplier une colonne par à multiplie le déterminant par a. 

On est ramené alors au cas d’une matrice triangulaire qui est assez facile : 


THÉORÈME: Le déterminant d’une matrice triangulaire est égal au produit de ses 
coefficients diagonaux : 


det ; = 411... Ann 


0 A 


Démonstration: Notons e1,...,e, les vecteurs de la base canonique de R”. Ce 
déterminant est le déterminant des vecteurs aj1€1 + ..., @2262 + ..., ..., Gnnen €t est 
donc aussi le déterminant de a11€1, @22€2, ..., Annen. Ce dernier déterminant est égal à 
dress ddelléhenssen) dis du 


Une autre technique souvent utile et également basée sur la multilinéarité du déter- 
minant est la suivante : 


THÉORÈME: (développement par rapport à une colonne) On a la formule suivante : 


@15 @15 
, n ë 
det : —= S (1) Tai; det il di din 
i=1 
An Anj 


où la “croix” signifie que l’on a retiré la i-ème ligne et la j-ème colonne. 


Démonstration: La j-ème colonne s'écrit ÿ', aie; donc par linéarité on peut se ramener 
au cas où la colonne est le vecteur e;. Si l’on ramène la 5-ème ligne sur la première ligne, 
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on multiplie le déterminant par (—1)*7 (compter le nombre de transpositions) et on doit 


juste vérifier que 
1  xx% 
det [ 0 4 | = det(A) 


Ce qui est laissé au lecteur. [I 


Exemple (calcul de déterminant 3 x 3 à partir de déterminants 2 x 2 : 


3 4 6 
det [| 8 1 —1 = (43) det (( 3 )-@ae (6 1.) + (-2)det (1 5 )=-9 
er dd 0 1 ue 


Lagrange Joseph (1736-1813) 
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CHAPITRE 11 GÉOMÉTRIE DANS LE PLAN ET L'ESPACE 


Ce chapitre reprend les notions d’algèbre linéaire en intégrant les concepts de produit 
scalaire et d’orthogonalité étudiés au lycée. Outre la description d'exemples d’isométries 
(rotations, symétries orthogonales, translations) l’illustration principale est le calcul de la 
distance d’un point à une droite ou un plan. D'un point de vue algébrique, on identifie 
le “plan” avec R? et l’espace à trois dimensions avec R°. On notera qu'avec ces identi- 
fications une “droite” dans le plan possède une équation du type ax + by + c et n’est pas 
un espace vectoriel (sauf si c = 0); on appellera “droite vectorielle” une droite d’équation 
ax + by = 0. De même on parlera de plan d’équation ax + by + cz + d = 0 dans l’espace 
R°; un plan vectoriel est un plan d’équation ax + by + cz = 0. 


11.1 PRODUIT SCALAIRE ET ISOMÉTRIES. 


Commençons par rappeler les définitions suivantes dans l’espace à trois dimensions 
R* (nous vous laissons formuler les mêmes définitions dans le plan R?). 


Définition: On appelle produit scalaire de deux vecteurs x,y € R° de coordonnées 
1,22, 23, TeSP. Y1, Yo, Y3 le nombre : 


(x + y) := TiYi +... + TnYn. 
Les vecteurs x et y sont orthogonaux si (x + y) = 0. 


Définition: On appelle norme euclidienne du vecteur x de R*° le nombre : 


Ixil:= (xx) = 1/2? + 22 + 2. 


La distance euclidienne entre deux vecteurs x et y de R° est définie par la formule : 


distance (x, y) := d(x,y) = [le —yll = {ai y)? + (x2 — 23)? + (as — ys)?. 


Enfin un vecteur x est dit unitaire si ||x|| = 1. 

Remarques. a) (Théorème de Pythagore!) Soient x,y,z € R” tels que x — z soit 
orthogonal à y — z (i.e. les trois points forment un triangle rectangle en z) alors : 

dx, y)" = [le — y = [Ie — 2) — (y — 21 = 1e — 247 — 2x — 2) (y — 2) + [y — 2° 
= Île — 21? + 1ly — 21 = d(x, 2)° + d(y, 2)°. 

b) Soit x un vecteur non nul, on peut toujours écrire x = ||x|| Ti donc comme un vecteur 
unitaire (la direction donnée par x) multiplié par un scalaire positif (sa longueur ou norme). 
c) Pour écrire l’équation d’une droite vectorielle D dans le plan, disons ax + by = 0, on 


peut aussi simplement prendre le vecteur u de coordonnée a et b et observer que, si X est 
le vecteur de coordonnées x, y, on peut écrire l’équation du plan 


(u- X) = 0. 
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Ainsi la donnée de la droite (vectorielle) équivaut à la donnée d’un vecteur orthogonal à 
cette droite. Cette remarque permet de passer facilement d’une base de D à une équation. 


Les principales propriétés de la norme euclidienne sont résumées dans la proposition 
suivante (les trois premières propriétés caractérisant les normes). 


PROPOSITION: La norme euclidienne sur R° vérifie pour tout x,y € R° 
(i) On a |x|| > 0 avec égalité si et seulement si x = 0; 


(ii) Pour a € R, on a |jax|| = ja||x||; 
(iii) (inégalité triangulaire) ||x + y|| < ||x|| + [|yll. De plus on a l'inégalité de Cauchy- 
Schwarz : 


Ge: y) lriga + day + zsysl < [x]] ]lyll. 


(iv) distance (x, y) > 0 (avec égalité seulement si x — y) 
(v) distance (x, y) < distance (x, z) + distance (z, y). 


Remarque. Dans le plan, on sait (et l’on va revoir cela) que, si 0 est l’angle entre les 
deux vecteurs x et y, alors (x: y) = cos 0 [[x{|||y|| ; l'inégalité de Cauchy-Schwarz équivaut 
donc dans ce cas à | cos 0] < 1. 


Démonstration: Les deux premières propriétés sont immédiates, les points (iv) et (vw) 
se déduisent facilement de (4), (ii) et (iii) ; montrons la troisième à l’aide de l'inégalité de 
Cauchy-Schwarz. On écrit pour cela : 


[Le + y = (1 +41) + (ca + ve) + (as +48) = [el + 2x4) + Il 
2 
< [el + 2lell all + y = Cell + Nul) 


Pour démontrer l’inégalité de Cauchy-Schwarz on utilise l’astuce suivante. On calcule, 
pourtER : 
0 < [le + ty = [fe]? + 2x: y) + ÉIlyIlÉ. 


On remarque alors que, si un polynôme a + 2bt + ct? est constamment positif, alors À — 
b? — ac < 0, ce qui s’écrit ici (x y)? — ||x||?||y[[? < O0, d’où l'inégalité cherchée se déduit. D 


PROPOSITION: Soit D une droite vectorielle de R?, l’orthogonal de D, noté D+ :— 
{x € R° | Vy € D, (x-y) = 0} est un plan vectoriel supplémentaire de D (c'est-à- 
dire que R° = D @ D+). Soit II une plan vectoriel de R*, l’orthogonal de Il, noté 
I := {x € R° | Vy € IL, (x-y) = 0} est une droite vectorielle supplémentaire de II 
(c'est-à-dire que R° =I1@II+). 


Démonstration: Du point de vue de l'algèbre linéaire, il est immédiat que D+ est 
un sous-espace vectoriel et que D NM D+ = {0}, il faut donc prouver que dim D+ = 2. 
Pour cela introduisons une base f1 de D et l’application linéaire ® : R° — R définie par 
(x) = (f1-x). Par construction Kerg = D+; montrons que ® est surjective et donc 
que dim D+ = dim Ker ® = 2 comme annoncé. Si ®& n’était pas surjective, l’image serait 
nulle et on aurait, pour tout æ € R° : (f1-x) = 0, ce qui entraînerait f1 = 0 et une 
contradiction. La deuxième affirmation se prouve de façon analogue. [ 


97 


Remarque. L’orthogonal d’une droite dans le plan R? est une droite, on peut résumer 
cela en disant que si Æ est un sous-espace, £ @ E+ est l’espace total. 


Définition: Une base e1,e2,e3 de R° est orthogonale si les vecteurs e; sont deux à deux 
orthogonaux; la base est orthonormée si de plus |[e;|| = 1. 
Exemple : on voit immédiatement que la base canonique de R° est orthonormée. 


THÉORÈME: (Procédé d’orthogonalisation de Gram-Schmidt) Soit u1,u2,u3 une base 
(quelconque) de R*, on peut obtenir une base orthogonale v1,v2, v3 de la forme suivante : 
Vi = Uy, Vo = U2 + AU, V3 = U3 + bu + cu1 pour certains réels a,b,c. Pour obtenir une 
base orthonormée, on remplace v; par v! := v;/||lv;||. 


Démonstration: La construction se réalise étape par étape. On pose donc vw, = u: 
ensuite on cherche a € R tel que (u2+au1):u1 = 0 et on trouve donc a = —(u2-u1)/|[u1||?, 
ainsi on choisit Vo := U2 — eu. Ensuite on cherche vw; de la forme v3 = u3 + ÀU2 + vi 
(il sera bien de la forme u3 + bu + cui) tel que (v3 + va) — (v3 : v1) — 0; on trouve 
comme conditions (us : v2) + A|v||? = (us : v1) + u[[v1l|? = 0 d’où le choix v3 = u3 — 
Leu — Leur. La matrice faisant passer de u1,u2,u3 à V1, V2, U3 est inversible (elle 


est triangulaire avec des 1 sur la diagonale) donc v1, v2, v3 est bien une base orthogonale. O 


Définition: On appelle isométrie de R° une application f : R° — R° qui préserve la 
distance, c’est-à-dire telle que pour tout x,y € R° on a |}f(x) — f(y)|| = [|x — y||. 


PROPOSITION: Soit u : R° — R° une application linéaire, alors les propriétés 
suivantes sont équivalentes : 
(i) u préserve la distance (i.e. est une isométrie). 
(ii) u préserve la norme (ï.e.pour tout x € R° on a ||f(x)|| = ||x||). 
(iii) u préserve le produit scalaire (i.e.pour tout x,y € R° on a (f(x) + f(y)) = (x : y)). 


Démonstration: Si une application linéaire f préserve la distance, elle préserve la 
norme car ||f(x)|| = d(f(x),0) = d(f(x), f(0)) = d(x,0) = [|xil. Si f préserve la norme 
elle préserve le produit scalaire car 


1 
Gy) = 5 (le +ulf ef fr: 


Enfin si f préserve le produit scalaire elle préserve la distance puisque d(f(x), f(y)) vaut 


VC) — f(u))- (FC) — Fu) = VF (x — y): f(x — y) = V{x — y)- (x — y) = d(x, y). 


(me 


Remarque. On peut démontrer qu’une isométrie s’écrit nécessairement f(x) = u(x)+a 
avec u isométrie linéaire (en particulier telle que u(0) = 0) et a € R°. En effet quitte à 
remplacer f(x) par f(x) — f(0) on peut supposer que f(0) = 0. Soit e1,e2,e3 une base 
orthonormée (par exemple la base canonique) alors les el := f(e;) forment aussi une base 
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orthonormée. Soit x € R*, on peut l'écrire x = x1e1+72e2+x3e3 et on note que (x-e;) = x;. 
Si on écrit de même f(x) = yie + y2e, + yse, et on observe que (f(x) - el) = y; et ainsi : 


mi =(x-e) = (f(x): f(e):) = (f(x) - €) = wi. 
ce qui montre bien que f(x1e1 + x262 + x3e3) = t1f(e1) + r2f(e2) + x3f(e3) et que f est 
linéaire. 
Caractérisation matricielle des isométries. 
PROPOSITION: Soit A la matrice d’une application linéaire R° — R*, l'application 
est une isométrie si et seulement si AA = I ou encore si ses colonnes fournissent une base 
orthonormée de R°. 


Démonstration: Le produit scalaire de deux vecteurs (écrits en colonne) X et Y 
s'écrit en termes de matrices !XY donc si À est la matrice d’une application linéaire de 
R* dans R*, celle-ci est une isométrie si et seulement si {AX)(AY) — XY ou encore 
IX(AA)Y = XY pour tout X,Y € R* ce qui entraîne facilement ‘AA = I. Ensuite une 
autre interprétation d’une isométrie linéaire est une transformation linéaire qui transforme 
la base canonique en une base orthonormée, ou encore que ses vecteurs colonnes forment 
une base orthonormée de R°. O 


Remarque : Si À est la matrice d’une isométrie, on observe que 1 = det(fAA) — 
det(‘4) det(A) = det(A}? et donc det(A) = +1. Ceci justifie la définition suivante : 


Définition: Une base e1,e2,e3 est une base directe (resp. indirecte) si det(e1,e2,e3) > 0 
(resp. si det(e1,e2,e3) < 0). Une isométrie linéaire u est directe (resp. indirecte) si 
det(u) = +1 (resp. si det(u) — —1). Une isométrie est directe (resp. indirecte) si sa partie 
linéaire est directe (resp. indirecte). 


base directe base indirecte 


Exemples d’isométrie de R? ou R*. 

(a) Translation dans R. L'application f(x) = x + a est clairement une isométrie, remar- 
quons que, sauf le cas trivial à = 0, la transformation n’a aucun point fixe. C’est une 
isométrie directe. 

(b) Rotation dans le plan (c’est une isométrie directe). On peut décrire en coordonnées 


! 
cartésiennes la rotation f d’angle 4 et centre C = (x0, yo) en notant o ) = f (;) : 


y 
Gux)- (ne au) GER) 


(c) Symétrie par rapport à une droite dans le plan (resp. par rapport à un plan dans 
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l’espace). Soit II un hyperplan de R* et y un vecteur unitaire orthogonal à Il; tout 
vecteur x de R° se décompose de façon unique en x = Ày + x2 avec }ERet x EIl. 
On pose alors 

f(x) := — y + ro. 


Par exemple la symétrie orthogonale par rapport au plan (y-x) = 0 s’écrit : 


EU Leu 
TT 


On vérifie que f est bien une isométrie qui est indirecte. 


Enfin on peut composer deux isométries ou prendre la bijection inverse (vérifier que le 
résultat est toujours une isométrie). Une notion un peu plus générale est celle de similitude 
i.e. de transformation de R>° qui dilate d’un facteur constant les distances, c’est-à-dire telle 
qu’il existe u > 0 tel que : 


Va,yeR*,  d(f(x), f(y)) = ud(x,y). 


On montre facilement qu’une similitude est la composée d’une isométrie et d’une ho- 
mothétie. 


11.2 LE PLAN EUCLIDIEN (DIMENSION 2) 


Rappel. Nous avons vu que e" = et®" si et seulement si 4 = 0 +2kr (avec k € Z), 
ce qui se traduit par : 


ee : cie — 0 —=0+2kT (avec k € Z) 


Nous dirons simplement que cosinus et sinus déterminent l’angle à 27 près. Inversement si 
a, bER vérifient a? + b? = 1 alors il existe un réel 0 (unique à 27 près) tel que cos(@) = a 
et sin(0) — b. Introduisons formellement la définition de l’angle. 


Définition: Soit u,v deux vecteurs unitaires non nuls du plan euclidien orienté (disons 
muni de la base canonique), on appelle angle de u vers v le réel 0 (unique modulo 27) 
cos(0) —sin(0) 
sin(0)  cos(6) 


vecteurs non nuls w et v est l’angle entre u/[[ul| et v/|[v||. 


tel que v s’obtienne en appliquant la rotation ( k L’angle entre deux 


Nous avons déjà vu deux exemples d’isométries linéaires : les rotations d’angle 4 et les 
symétries orthogonales par rapport à une droite vectorielle, on peut montrer que ce sont 
les seules (on donne l’énoncé sous forme matricielle). 
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THÉORÈME: Soit À une matrice orthogonale (la matrice d’une isométrie) et soit 
€ = +1 son déterminant, alors il existe 0 € R (unique modulo 27) tel que 


= (6 conte) 


Ainsi À correspond soit à la rotation d’angle 0, soit à la symétrie orthogonale par rapport 
à la droite vectorielle faisant un angle 0/2 avec l’axe des x. 

Démonstration: Posons À — : A Les colonnes sont des vecteurs de normes 
1 donc on peut écrire a = cos(@), c — sin(0) et b — cos(@), d =: sin(@) et le produit 
scalaire des deux vecteurs colonne est nul, soit cos(@) cos(®) + sin(4) sin(g) — 0 ou encore 
cos(p — 0) — 0. On conclut donc que ® = 5 + 0 modulo 27 (avec € — +1) et ainsi 
b — cos(e5 + 0) — —-esin(d) et d = sin(e? + 0) — ecos(#), d’où le résultat annoncé. TO 


rotation d’angle à : symétrie orthogonale par rapport à D : 


A titre d'exercice on pourra en déduire une liste des isométries affines; ce sont : les 
rotations d’angle 0 et centre C’, les symétries orthogonales par rapport à une droite affine, 
les translations et les glissements (symétrie orthogonale par rapport à la droite D composée 
avec une translation parallèle à la droite D). 


Définition: On appelle distance d’un point P à une droite D (dans le plan) la borne 
inférieure des distances du point avec les points de la droite. En symbole : 


d(P. D) := inf d(P.Q). 


En particulier on voit que P € D entraîne que d(P, D) = 0. Voici le calcul en général : 
THÉORÈME: Soit D une droite du plan ayant pour équation ax + by + c = 0 et 
P = (xo,ÿo) un point du plan; la distance de P à D est donnée par 


__ Jaxo + byo + c| 
Va? + 


De plus il existe un unique point Q € D tel que d(P, D) = d(P, Q) et il peut être caractérisé 
par le fait que la droite PQ est orthogonale à D. 


d(P, D) 


Démonstration: Soit u un vecteur orthogonal à la droite D, la droite passant par P 
et de direction u rencontre D en un unique point Q. Commençons par montrer que Q 
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est l’unique point qui réalise la distance d(P, D). Soit en effet un autre point Q’ € D, 
par construction le vecteur PQ (qui est proportionnel à u) est orthogonal à QQ’ et donc 
d’après le “théorème de Pythagore” : 


d(P,Q') = d(P,Q)° +4d(Q,Q') > d(P,Q) 


avec égalité si et seulement si Q = Q'. Calculons maintenant d(P,Q) = d(P, D). Ecrivons 
pour cela l'équation de D ainsi : (x1 : z) + c = 0 et notons z0 le vecteur correspondant à 
P. On peut aussi écrire z = 20 + Àx1 et on aura ||2 — 20/| = [A] -||x1||. En écrivant que 
z € D, on obtient 0 = (x1:2)+c = (x1: 20) +c+Al|x1[[? d’où [À] = lente, On en tire 
d(P,Q) = |}2 — 2ol] = [(x1 - 20) + cl/Î[x1l|, ce qui est le résultat cherché. 0 


11.3 L'ESPACE EUCLIDIEN (DIMENSION 3) 


L'observation de la géométrie en dimension trois devrait nous apparaître naturelle. Il 
faut toutefois faire attention à certains phénomènes liés aux deux orientations possibles de 
l’espace, ainsi la question naïve suivante est en fait dépourvue de sens : “dans quel sens 
tourne la terre autour du soleil?”. Nous commencerons par y définir une notion d’angle 
entre deux vecteurs dont on verra qu’elle est différente de celle du plan (orienté). 


Le problème de définir et calculer l’angle de deux vecteurs dans l’espace peut sembler 
simple : on se dit qu’il suffit de considérer le plan engendré par les deux vecteurs et de 
calculer l’angle dans le plan... Observons cependant sur le dessin ci-dessous ce qui se passe 
si l’on se déplace dans l’espace. 


On s’aperçoit que l’on peut donner à l’angle plusieurs valeurs : 0, —0 ou 27 — 0...En 
particulier on peut toujours faire un choix tel que l’angle soit situé dans l'intervalle [0, 7]. 


Définition:  L’angle entre u et v dans l’espace (N.B. ne pas séparer les mots) est le réel 
0 € [0, x] tel qu’il existe une orientation du plan (u,v) tel que la rotation d’angle 0 envoie 
u SUT U. 


Le procédé suivant permet de fabriquer des bases directes ou orthonormées directes. 
Observons que, si u,v € R° et x € R> (de coordonnées +1, æ2 et x3) alors : 


À T1 
det(u,v,x) = Ax+By+Cz=|Bl|.|x 
C T3 


ce qui permet de définir 


Définition: Le produit vectoriel de u et v, noté u A v est le vecteur de R° tel que, pour 
tout x € R° on ait : 
(u A vu) -x = det(u, v, x). 
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On en tire l’expression analytique du produit vectoriel : 


Uj V1 U2U3 — U3U2 
u2 |" | V2 — | U3U01 — U1U3 
u3 V3 U1U2 — Ua] 


ainsi que ses principales propriétés : 


PROPOSITION: Le produit vectoriel est bilinéaire (i.e. linéaire en u et en v) et vérifie 
les formules suivantes. 
(i) vA u = —-u Av; en particulier u À u = 0. 
(ii) u A v est orthogonal à u et v. 
(iii) Si u,v sont indépendants et si l’angle de u à v est 0 € [0, x] alors 


lu Awll= sin(8) [Juif [loil. 


(On observera que, comme 0 € [0,7], on a sin(0) = |sin(0)| > 0). 


Démonstration: La première formule découle du fait que det{u,v,x) — — det(v, u, x) 
et la seconde du fait que (u A vu) -u = det(u,v,u) = 0. Pour la démonstration de (iii)on va 
introduire le déterminants de Gram de deux (ou trois ou etc) vecteurs : 


G(æ1, t2) := det ele Gi 1) 


T1 T2) EE 


Dans le cas de deux vecteurs u, v comme dans l’énoncé, on observera que l’on peut calculer 
ce dernier ainsi : 


Gu,v) = [ulF]olf — (uv)? = (1 — cos”(8))lull* lol? = sin/(8)Ilul#1ll?. 


Ensuite, posons w := uv et calculons de deux manières G{u,v,w). D'abord G{u, v,w) — 
lw||2G(u,v) car w est orthogonal à u et v. Ensuite montrons que 


G{u, v,w) = det(u, v, w)? (+) 


ce qui montrera que 


[lu A v|f = (u Av): w = det(u,v,w) = VG(u,v,w) = [|wl|G(u,v) = [lwl|sin(8)|lu|||ul| 


ce qui est la formule voulue après avoir divisé par |[wl|. Pour prouver la formule (+) 
on montre la règle de transformation suivante: G(f(u), f(v), f(w)) = det(f)}?G(u,v,w); 
comme det(f(u), f(v), f(w)) = det(f) det(u, v, w) et que la formule (+) est clairement vraie 
lorsque u, v,w est la base canonique, on en tire qu’elle est toujours vraie. [ 


COROLLAIRE: Soit u,v deux vecteurs unitaires orthogonaux, posons w := u/\v alors 
u,v,w forment une base orthonormée directe. 
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Démonstration: Les propriétés (1) et (iii) garantissent que u, v,w est une base or- 
thonormée et on a par construction det(u,v,w) = (u A v) :w = |luAv||? > 0.0 


Remarque. La donnée d’un plan vectoriel IT dans l’espace, d’équation disons ax + 
by + cz = 0, équivaut à la donnée du vecteur u de coordonnées a, b, c et on peut écrire en 
abrégé cette équation, en notant X le vecteur de coordonnée x, y, z : 


us À) = 0 


Connaissant une base u, v du plan IT on peut en déduire une équation du plan en calculant 
w := u À v; en effet une équation de II sera donnée par (w + X) = 0. 


Définition: On appelle distance d’un point à P un plan IT (dans l’espace) la borne 
inférieure des distances du point avec les points du plan. En symbole : 


d(P.II) := inf d(P.Q). 


En particulier on voit que P € IT entraîne que d(P, II) = 0. Voici le calcul en général : 
THÉORÈME: Soit Il un plan dans l’espace ayant pour équation ax + by + cz + d = 0 


et P = (x0, Yo, zo) un point de l’espace; la distance de P à IT est donnée par 


: lato un byo + CZo + d| 


Tree 


De plus il existe un unique point Q € IT tel que d(P, 1) = d(P, Q) et il peut être caractérisé 
par le fait que la droite PQ est orthogonale à II. 


Démonstration: Le lecteur observera la similarité de cet énoncé avec la formule donnant 
la distance d’un point à une droite dans le plan et, en regardant sa démonstration, verra 
qu’elle s'applique presque mot pour mot. 


Euclide [EvkAeôm] (environ 300 ans avant JC) 
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APPENDICE : RÉSUMÉ D’ALGÈBRE LINÉAIRE 


Cet appendice contient un résumé des résultats d’algèbre linéaire développés dans ce 
cours et une synthèse des différentes méthodes. On donne des applications du cours mais 
aucune démonstration (celles-ci sont contenues ou peuvent être extraites des chapitres 
précédents), en cela ce chapitre empiète un peu sur le travail de TD. 


A. DÉFINITIONS ET PROBLÈMES 


Doivent être connues les définitions d’un (sous-)espace vectoriel, d’une 
base, d’une partie libre ou génératrice. 


Etant donné une famille de vecteurs f1, f2,...,f,, on veut savoir si elle est libre, 
génératrice ou forme une base. On veut savoir aussi quel est son rang, c’est-à-dire quelle 
est la dimension de l’espace vectoriel qu’elle engendre. Si elle est libre, on veut savoir 
comment la compléter en une base (ce qui est possible d’après le théorème de la base 
incomplète). 


Un sous-espace vectoriel de R”' peut être donné par une base, une partie génératrice, 
par des équations ou par des équations en nombre minimal. Dans le premier et le dernier 
cas la dimension du sous-espace vectoriel est facile à calculer : c’est le cardinal d’une base 
et c’est aussi n moins le nombre minimal d'équations. 

Exemple: le sous-espace vectoriel E = {(x,y,z) € R° | x+y+2=0, x+y=0, z = 0} 
est aussi égal à {(x,y,z) € R° | x+y = 0, z = 0}; ilest engendré par les vecteurs (1, —1, 0), 
(—2,2,0) et (18, 18,0) et admet pour base le vecteur (1, —1,0). Il a pour dimension 1. 

Remarque: en géométrie analytique, on obtient souvent un sous-espace vectoriel sous 
forme paramétrique; en fait cela revient à se donner une partie génératrice: le sous-espace 
vectoriel engendré par f1,f2,...,f. est l’ensemble {#1 f1 +tofo +... +tsfs | (t1,...,t5) € 
R°}. 

Un problème se pose souvent : ayant des équations pour un sous-espace vectoriel, 
trouver une base et la dimension de ce sous-espace vectoriel. Inversement, ayant une base 
ou une partie génératrice, on veut trouver des équations. 


On sait que l’intersection ou la somme de deux sous-espaces vectoriels est encore un 
sous-espace vectoriel; un problème naturel est de calculer une base ou des équations de 
cette intersection ou (somme). En particulier deux sous-espaces vectoriels E et F sont en 
somme directe si EN EF = {0}. 


Doivent être connues les définitions d’une application linéaire, du noyau 
et de l’image, de la matrice de l’application linéaire par rapport à une base de 
l’espace de départ et une base de l’espace d’arrivée. 


Une application linéaire uw, disons de R” vers R?”” peut être donnée explicitement 
(exemple : u(x,y,2) = (x+y,2,x+y+2,2+4y)) ou par sa matrice dans des bases données 
de R’? et R’”? ou encore par une description géomètrique (exemples : la projection de 
R° vers R° sur un plan parallèlement à une droite, la rotation d'angle x/5 autour d’une 
droite de R). Dans le dernier cas, on veut trouver la matrice de u dans des base données, 
dans les premiers cas on veut trouver une interprétation géomètrique : ceci se fait le plus 
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souvent en choisissant de “bonnes” bases et en calculant la matrice de u dans ces bases. Les 
méthodes pour trouver de “bonnes” bases ne font pas partie du programme de première 
année, elles seront donc toujours données dans les problèmes et exemples. 


Dans tous les cas on veut calculer le noyau et l’image de l’application linéaire. 


On doit connaître les règles de calcul des matrices ainsi que la formule de 
changement de bases à l’aide des matrices de passages. 


Faire le produit de matrices permet de calculer la composée de deux applications 
linéaires (et vice versa). La formule de changement de bases (“4! = Q71AP”) permet 
de calculer la matrice d’une application linéaire dans de nouvelles bases, connaissant la 
matrice de l’application linéaire dans certaines bases. 


B. CALCULS PRATIQUES 


On donne une liste (non exhaustive) de problèmes d’algèbre linéaire et de méthodes 
pour les résoudre. Un autre titre à ce paragraphe aurait pu être : application de la méthode 
du pivot. 


a) Résolution de système linéaire. 


Soit à résoudre le système : 


Q1121 +... + Ginln = Di 


- On forme la matrice (A]b) avec À matrice m x n formée des coefficients a;; et b vecteur 
colonne formé des coefficients b;. - On échelonne la matrice (A|b) — (4'|b') et on regarde 
si il y a un pivot sur la dernière colonne. S'il y a un pivot, le système n’a pas de solution. 
Sinon, on repère les colonnes sans pivot de la matrice À’, elles correspondent aux vari- 
ables t;,,...,x%;.. Les solutions s’obtiennent toutes en fixant des valeurs arbitraires aux 
inconnues %;,,...,%;, et en exprimant les autres en fonction de celles-ci. 

Commentaires : l’ensemble des solutions est de la forme “solution particulière + 
solution de l’équation homogène” et la dimension des solutions est le nombre de colonne 
de À’ sans pivot. Si b = 0, il suffit d’échelonner À — 4’ et de raisonner sur À’. 


b) calcul sur les vecteurs. 


Soit f1,...,/f, une famille de vecteurs d’un espace vectoriel (disons R’ pour fixer les 
idéees). 


Pour vérifier si f1,...,f, est libre, on résoud le système linéaire +1 f1 +...+x, fr = 0. 
Les vecteurs f1,...,/f, sont libres si la seule solution est æ1 =... = x, — 0 (si la matrice 
échelonnée correspondante n’a pas de colonne sans pivot). 

Pour vérifier si f1,...,f, est génératrice de R?, on résoud le système 21 f1+...+2, fr = 
b. Les vecteurs f1,...,f, sont générateurs si le système a une solution pour tout b € R”. 
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Note: Les vecteurs f1,...,f, ne peuvent être indépendants dans R? que si s < n et 
générateurs que si s > n. Dans le cas particulier s = n, rappelons que libres entraîne 
générateurs (et base), ce qui économise souvent des calculs. 

Pour extraire une partie libre maximale, on échelonne et on ne garde que les f; cor- 
respondant à une colonne avec pivot. 

Pour compléter une partie libre f1,...,f, en une base, on peut ajouter à ces vecteurs 
des générateurs de l’espace (par exemple la base canonique) et extraire de la partie géné- 
ratrice f1,...,fs,€1,...€n une partie libre maximale par la méthode précédente. 


Pour exprimer un vecteur b dans une base f:1,...,f., on résoud le système æ1 f1 +...+ 
zrfr = b (dont on sait qu’il possède une solution unique). 


c) calcul sur les sous — espaces vectoriels. 


Soit un sous-espace vectoriel E de R? défini par les équations: 


@1121 +... + Gintn = 0 


La résolution (par la méthode du pivot) du système linéaire décrit par ces équations donne 
la dimension de E et permet d’exprimer les variables “avec pivot” en fonction des autres, 
d’où le calcul d’une base. 

Exemple : si le résultat des calculs donne comme solution que +1 et x2 sont des 


T1 1 
; S 0 
variables libres et que x3 = 2x1 — 7x2, æ4 = —2%1 + 4x2 alors = 9 + 
3 
TA —2 
0 1 0 
1 / 0 1 
t | y et donc une base est donnée par 9 et 7 
4 —2 4 
Soit maintenant un sous-espace vectoriel E de R’' donné par une partie génératrice 
f1:...,/s, pour calculer des équations définissant Æ on cherche à résoudre le système 
bi 
æifi+...+xsfs = | ‘ |. La méthode du pivot donne des conditions linéaires sur les b; 
bn 
bi 
pour que le système ait une solution ; ces conditions donnent les équations pour que 
bn 
soit dans Æ. Une base de E s’obtient en extrayant une partie libre maximale de f1,..., fs. 


d) calcul d’intersection, somme de sous — espaces. 
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Si E et F' sont donnés par des équations, alors ENF est donné par la réunion des deux 
paquets d'équations. Si E et F sont donnés chacun par une partie génératrice, alors une 
partie génératrice de l’espace E + Fest donné par la réunion des deux parties génératrices 
de E et F. Grâce à c) ont peut donc calculer intersection et somme de sous-espace vectoriel 
(leurs dimensions, une base etc). 


e) calcul du noyau et image d’une application linéaire. 


Soit u : R°? — R7" donnée par 
T1 @11X1 +... + GinEn 
Tn ni 8 dnnln 


Pour calculer Ker(u) et Im(u), ainsi que leurs dimensions, on forme la matrice (Ab) 
avec À = (a;;) et b € R’”; on l’échelonne : (AÏb) — (A)b'). Le noyau est obtenu en 
calculant les solutions du système avec b — 0, sa dimension est le nombre de colonnes sans 
pivot de 4’; l’image est définie par les équations linéaires en b; écrivant que le système 
associé à (A|b) a une solution, sa dimension est le nombre de colonnes avec pivot de 4’ 
(on peut vérifier que dim Ker(u) + dimlm(u) = n). De plus une base de Im(u) peut 
être obtenue à l’aide des vecteurs e; de la base canonique en ne retenant que les indices 
correspondant à une colonne avec pivot. 


f) calcul sur les matrices. 


Le chapitre sur les matrices étant essentiellement calculatoire on ne révise que quelques 
points; en particulier il faut aller voir dans le chapitre 7 la méthode donnée pour calculer 
l'inverse A7! d’une matrice (ou conclure qu’il n’existe pas) et réviser dans le chapitre 9 le 
calcul des matrices de passage et de changements de base. 


Soit u : R°? — R?7" donnée par 


T1 1121 +... + Ginln 
u = pds 
Tn Gm1L1 +... + AmnEn 
Soit e1,...,en une base de R” et f1,..., fm une base de R””. Pour calculer B la matrice 


de u dans ces bases, on exprime chacun des vecteurs u(e;) comme combinaison linéaire des 
f; avec la méthode donnée en b): 


u(ei) = buifi +... + bimifm 


et les coefficients de B sont donnés par les b;;. 
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CHAPITRE 12 SUITES DE NOMBRES RÉELS OU COMPLEXES 


La notion de suite est connue et étudiée depuis la terminale ; elle permet de décrire 
des processus itératifs numériques et contient en germe la notion de limite. La raison 
fondamentale de son importance est la possibilité d'approcher des phénomènes continus 
par des quantités discrètes : on approche un nombre réel par son développement décimal 
à l’ordre n, on trace un graphe en calculant des valeurs discrètes — tout calcul numérique 
effectué sur un ordinateur repose sur ce principe. Inversement c’est un sujet qui se prête 
bien aux expérimentations sur machine ou calculatrice. Ceci explique aussi que souvent on 
ne se contente pas de savoir qu’une suite approche un nombre ; on veut aussi savoir avec 
quelle précision le n-ième terme approche le nombre. 


12.1 PROPRIÉTÉS GÉNÉRALES DES SUITES 
Répétons les définitions données au chapitre 4 : 


Définition: Une suite réelle ou complexe est une application u : N — R ou C. On note 
Un := ü(n) et on l’appelle le n-ième terme de la suite. La suite elle-même est notée (u;)1eN 
ou plus simplement (u,) (cette dernière notation étant un peu abusive mais usuelle). 


Définition: Une suite (réelle ou complexe) (u,),enN est convergente vers L si 


Ve> 0, IEeN,n>n0— lun —{|<E 


On dit aussi que £ est la limite de la suite. Une suite est divergente si elle ne converge vers 
aucun nombre. 


Remarques : i) les premiers termes d’une suite n’ont pas d'importance ; en particulier 
leurs valeurs n’influent en rien sur la convergence de la suite ; c’est pourquoi on les néglige 
souvent et on commettra même l’abus de langage consistant par exemple à parler de la 
suite un — 1/n alors que le terme ug n’est pas défini. 

ii) Par ailleurs une suite n’est pas forcément convergente, par exemple les suites uy — 
(—1)" ou v, — sin(n) ne sont pas convergentes (essayez de le démontrer!). 

ii) On peut généraliser la définition de limite (pour une suite réelle) en décrétant que 
limu, = +oo si VM > 0, 1m EN, n > n0 = uy > M (idem pour —-æ). Nous réserverons 
néanmoins l’appellation “convergente” aux suites ayant une limite finie. 


PROPOSITION: Une suite convergente est bornée. 


Démonstration: Si (u,) est convergente, il existe n9 et £ tel que pour n > no on ait 
lun — | < 1 donc [u,| < |£| +1. Posons donc M := max{|uo|,...,[un,|, [£| + 1} alors on a 
pour tout n € N l'inégalité [u,| < M. D 


La réciproque est fausse puisque les deux suites déjà mentionnées u, — (—1)"” ou 
Un —= Sin(n) ne sont pas convergentes mais pourtant bornées. Néanmoins une propriété 
saute aux yeux, au moins pour la première suite : la “sous-suite” u2, converge (elle est 
en fait constante). L'existence d’une sous-suite convergente est une propriété générale des 
suites bornées (théorème de Bolzano-Weierstrass) que nous citons pour mémoire. Voyons 
maintenant quelles opérations on peut effectuer sur les limites de suites. 
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THÉORÈME: Silimu, —£Letlimw, — L' alors 

i) lim(aux + bun) = al + bl' 

ü) tu) 47 

iii) Si L' Z 0 alors lim(u,/vn) = L/l 

Dans le cas ou l’une de ces limites est infinie ces formules restent valables à condition 
d’appliquer les règles suivantes : 

+00 + 00 = +00 


+00 + a = +00 
—00 — 00 = —00 
—O00 + & — —00 
Si a > 0 alors a(+o) = +00 
si a < 0 alors a(+) = —c 


(+oo).(+00) = +00 
(—c0).(—00) = +00 
Silimu, — 0 mais (au moins à partir d’un certain rang) u, Z 0 alors lim 1 — +00. 


lun | 


De plus si en fait u, > 0 (resp. un < 0) alors lim + = +0 (resp. = —o). 


Démonstration: (i) Soit £ > 0 donné, choisissons £’ > 0 tel que (|a] + [b|)e' < € ; par 
définition des limites, il existe no et n1 tels que si n > no alors [u, — {| <e’ et sin > m1 
alors |[v, — L/| < €’. Si maintenant n > max(no, m1) alors (au, + bus) — (al + bl')] < 
lallun —£|+1bllu, — LT < (lal+1bl)e' < € ; ce qui prouve bien que lim(au, +bv,) = al+bl'. 
(ii) Observons que d’après les hypothèses et la proposition précédente u, est bornée 
par, disons, M. Soit € > 0 donné, choisissons €’ > 0 tel que (M+{{/|)e' < € ; par définition 
des limites, il existe no et n1 tels que si n > no alors |u, — {| < e! et si n > n1 alors 
[un —£/| <e’. Si maintenant n > max(no, n1) alors [uyun —Æ0/| < lunl[un —2/}+|L'Îlus —4] < 
(M + {l'E < € ; ce qui prouve bien que lim unvn = {{’. 
2 


(ii) On utilise cette fois-ci que si n > no alors mal _ FAI et l'inégalité |» 


l 
RS 


, 
lune + er 

La démonstration des autres énoncés est assez immédiate en appliquant le même 
raisonnement (il est recommandé toutefois d’essayer de faire la démonstration des cas 
laissés indéterminés et de voir “qu’est-ce-qui ne marche pas”). Démontrons par exemple 
le dernier énoncé lorsque u, > 0 et limu, = 0 : soit donc M > 0 alors il existe no € NN tel 
que si n > no alors 0 < un < _ et donc — > M ; ce qui prouve bien que lim — = +00. 
CO 


Remarque : par contre 0.00, © et +co — œ ne sont pas définis (c’est-à-dire que ces 


seules informations ne sont pas suffisantes pour conclure). En effet choisissons par exemple 
Un := l/n et Un := n, wy := MN, ty := n°? alors la première tend vers zéro alors que les 
autres tendent vers plus l'infini ; pourtant limu,v, = 1, limu,w, = 0 et limu,tn = +oo. 


COROLLAIRE: Soit u, une suite convergente et v, une suite divergente alors un +Un 
est divergente. 


Démonstration: En effet si un + vn était convergente cela entraînerait que la suite 
Un = (Un + Un) — (Un) serait également convergente. 
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Exemple : considérons la suite u,, := sin(n) + Eu + (—1)"e”. Alors les deux suites 


En et (—1)"e” sont convergentes (vers 0) mais la suite sin(n) est divergente donc la 
suite u, est divergente. 
Rappelons qu’une suite (réelle) monotone et bornée est convergente (chapitre 4). La 


variante suivante est souvent utile : 


THÉORÈME: (suites adjacentes) Soient u, et v, deux suites réelles telles que : 
(i) un est croissante et v, est décroissante 
(ii) La suite vn — u, est positive et converge vers 0 
alors un et vn Convergent toutes deux vers la même limite. 


Démonstration: La suite u, est croissante et majorée par vo donc est convergente 
(disons vers £) ; la suite v, est décroissante et minorée par us donc convergente (disons 
vers {’). La dernière condition entraîne que {= L{'. D 


Exemples : 1) Un des exemples les plus classiques est le suivant : on choisit 0 < a < bet 
on pose üo := a et vo = bet on définit par récurrence u541 := 4/UnUn et Un+1 := (un+Un)/2. 
La limite commune s’appelle la “moyenne arithmético-géométrique” de a et b. 

Vérifions que u» et vn sont adjacentes : on à uo < vo par hypothèse et si n > 1 alors 
Un — Un = (uni +1 24/Un 10 1) = L(/On=1 — Un-1)? > 0 donc u, < v,. Ensuite 
Un+1 = (Un + Un)/2 < Un et Un+1 := VUnUn > Un donc u, est croissante et majorée donc 
convergente, disons vers £ et v, est décroissante et minorée donc convergente vers // mais 
l'=(L+0)/2 donc { = !'. 

De v, — Un = 5 (Tn=1 — YUn=1) = DIET 9m (Un_1 —Un_1})° on tire [un — un] < 
C(Un-1 — Un-1)? (avec C := ax) donc la convergence de la suite est très rapide (chaque 
pas double le nombre de chiffres de précision). Par exemple si a := 2 et b := 8 on trouve 
u1 = 4, u2 = 4,47213..., u3 = 4,48604... et v1 = 5, v2 = 4,5, v3 = 4, 48606... 

2) Nous avons déjà étudié (chapitre 4) un autre exemple de suites adjacentes : soit x un 
réel et soit u, son développement décimal par défaut à l’ordre n et v, son développement 
décimal par excès à l’ordre n alors u, et v, sont adjacentes et convergent vers x (bien sûr, 
chaque pas ajoute un chiffre de précision). 

3) La suite un := 1 + _ + ï D uE _ est convergente. En effet introduisons v, :—= 
Un+ : visiblement u, est croissante, u, < v, et lim(v,—u,) = 0 mais de plus vy11—v» — 
GO D < 0 donc v, est décroissante et les suites sont adjacentes. Si l’on appelle e la 
limite commune (nous verrons au chapitre 14 que c’est bien la base du logarithme népérien) 
on a: 0<e—un < ==. La suite u, fournit donc de très bonnes approximations de e. 
Par exemple u1 = 2, u2 = 2,5, us — 2,66666..., ua — 2,708333..., us — 2,71666... et 
Un 30 = 2,75, va — 9, 70299. ua = 2, 71874... vs — 2, 718399... 


12.2 SUITES RÉCURRENTES 


Le cas le plus général est celui d’une suite où u,, s'exprime en fonction de u9,...,un_1 ; 
nous étudierons seulement deux cas. 


12.2.1 Suites du type uy11 — f(u») 


Les exemples les plus simples de telles suites sont : 
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Les suites arithmétiques définies par un+1 = un + a : on déduit immédiatement que 
Un = Uo + na et que Uo +... + Un = (n + 1)uo + "rt, En particulier, si u, est réelle 
limu, = +0 si a > 0, limu, = —o si a < 0 Cr si a — Ü). 

Les suites géométriques définies par u1+1 = au, : on déduit immédiatement que 


Un = Uoa” et que üo +... + un = (n + l)uo si a = 1 et 4 _ uo si a Z 1. En particulier 


lim un = 0 si [al < 1 et limlu,| = +oo si [a > 1. Si |a| = 1 donc a = e*, la situation est 
plus compliquée : la suite reste sur le cercle |2| = [up] et u,+1 s'obtient à partir de u, par 
une rotation d'angle 0 ; si 0/x € Q alors la suite est périodique, sinon elle tourne de façon 
“dense” sur le cercle (c’est nettement plus difficile à montrer). 

On peut donner un exemple plus compliqué où l’on arrive néanmoins à exprimer u, 


; ; . a j j 
par une formule fermée : soit la suite définie par un41 = 3 (un — æ) ; POSONS Un — tute 
alors un calcul direct fournit la relation wh+1 = w2 d’où wy = we" et 

oc 
Uuo+ 
w8 +1 (ut) el 
nm — on => on 
WG — 1 (uit) 1 
uo—1 
On en déduit par exemple que si ir < 1 alors limu, — —1 alors que si ei > 1 


alors limu, — 1. On a vu au chapitre 4 que l’équation Et = = 


complexe, un cercle ou une droite ; ici c’est la droite des imaginaires. Si Re(uo) > 0 
(resp. si Re(uo) < 0) alors limu, = 1 (resp. limu, — —1) ; si uo € 4R la suite ne peut 
pas converger (ses valeurs sont purement imaginaires) et peut même ne pas être définie à 
partir d’un certain rang (si mot? rue) 


1 définit, dans le plan 


En général toutefois il est impossible d'exprimer w, par une formule simple et on doit 
recourir au raisonnement et à des considérations qualitatives. Une des propriétés les plus 
utiles de ces suites est la suivante (voir le cours de terminale ou le chapitre suivant pour 
la définition de la continuité) : 


THÉORÈME: Soit f:R —R une fonction continue et soit u, une suite vérifiant la 
relation Uun+1 = f(un) ; si u, converge vers L alors { = f(£) 


Remarque : le théorème ne dit pas que cette suite converge mais seulement que 
l’ensemble des “limites potentielles” est restreint. 


Démonstration: D’après une propriété des fonctions continues : lim f(u,) = f(limu,) 
donc vues les hypothèses 


reine lim) flme:)= ft 


( 


Pour nous aider à déterminer quand une telle suite converge effectivement vers un 
point fixe { de f, il est très éclairant de tracer le diagramme suivant qui décrit visuellement 
l’itération de la fonction f : on représente le graphe y = f(x) de la fonction f et la droite 
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y = æ ; connaissant Uo, l'intersection de la droite verticale x — uo avec le graphe donne 
le point (wo, f(uo)) = (uo, ui), l'intersection de la droite horizontale passant par ce point 
avec la droite y — x donne le point (w1,u1), l'intersection de la droite verticale passant par 
ce dernier point avec le graphe de f fournit le point (u1, f(u1) = (u1,u2) et ainsi de suite 


Représentation graphique de quelques suites récurrentes suivant la valeur de a := f’(4) 


Ces graphiques suggèrent que si [a] = |f'(£)| < 1 alors la suite semble converger vers 
£ (disons que le point fixe £ est attracteur ou stable) et si la] = |f'(4)] > 1 alors la suite 
ne semble pas converger vers £ (disons que le point fixe £ est répulsif ou instable). Dans le 
premier cas, si 0 < a < 1 la suite semble converger de façon monotone vers {, par contre 
si —1 < a < 0 la suite semble converger de façon alternée vers £. On peut démontrer (si f 
est deux fois continument dérivable) grâce à la formule de Taylor que c’est bien ce qui se 
passe pourvu que w soit suffisamment proche de £. Illustrons cela par quelques exemples : 

Un+1 = VUn +5 (avec uo > —5) : 


On constate que u1 > 0 et ensuite u, > 0 donc la suite est bien définie. Si elle 
converge vers L alors { doit être positive et vérifier { = V{ +5 donc £ = 2 est la seule 
limite possible. Le tracé du graphe y = x +5 et de l’itération suggère que si uo < L 
(resp. uo > L) alors u, est croissante (resp. décroissante) et converge vers {, démontrons 
cela. Tout d’abord la fonction f(x) := x +5 est croissante donc u, < £ (resp. u» > &) 
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entraîne Un+1 = f(un) < f(L) = £ (resp. un+1 > L). Ensuite 


Un + 5 — u2 (un — 2) (u, — 1-21) 


Uni — Un = ———]—<— = — 
su VUün +5 +Un VUn +5 +Un 


est positif si un < £ et négatif si u, > £. En conclusion si uo < £ alors u, est croissante et 
majorée par { donc convergente et la limite doit être £ ; si uo > L alors u,, est décroissante 
et minorée par £ donc convergente et la limite doit être {. On remarquera que la pente du 
graphe en x — { est positive et inférieure à 1 (exactement : 0 < a — >). 


Si l'on reprend la suite u,41 = Su, + 1/u,) on observe sur le graphe que les deux 
limites possibles, +1 et —1, sont attracteurs. 


On “voit” que si uo > 0 alors la suite va converger vers 1 et si uo < 0 alors elle va 
converger vers —1 (ce que l’on a déjà démontré directement). 


ii = cunt? : on suppose ad — bc et c différent de zéro (sinon la suite est constante 


ou linéaire) et également uy Æ —d/c. Si la suite converge vers une limite £ alors celle-ci 
vérifie c£? + (d— a){ —b = 0. On doit distinguer deux cas : ou bien (d — a)? + 4bc Z£ 0 et il 
y a deux limites possibles (réelles ou complexes), disons a et B, ou bien (d — a)? + 4bc = 0 
et il y a une seule limite possible, disons à. 


Si a, b,c,d sont réels, pour tracer le graphe des fonctions f(x) = arte observons que 
y = f(x) équivaut à y — {= — _ /(x + a) et donc, à translation près le graphe est celui 


de la fonction C/x et dépend donc du signe de C!. 
Cas où ad — bc < 0 : 


Cas où ad — bc > 0 


On constate que dans le premier cas il y a deux limites possibles et que la suite semble 
converger vers l’une d’elles (toujours la même) : l’un des points est attracteur, l’autre est 
répulsif. Dans le deuxième cas il peut y avoir deux limites possibles, une seule ou aucune 
(ie. a et BG sont complexes) ; dans ce dernier cas il est clair que la suite ne peut converger. 
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On peut étudier un peu plus profondément ces suites ainsi : dans le cas ou a et GB 


sont distinctes, introduisons la suite v, — te, Un calcul direct utilisant que a et 6 sont 
les racines de cX? + (d — a)X — b donne vy11 = À avec À :— —_. Alors si |À] < 1 on 


en déduit limw, = 0 et limu, = B ; si |A] > 1 on en déduit lim |v,| = +o et limu, = a. 
Le cas où || — 1 est plus compliqué ; c’est notamment ce qui se produit si les coefficients 
sont réels et à, complexes conjugués. 

Si a est la seule limite possible, on introduit v, := — _ et de nouveau un calcul 
direct fournit Uy+1 = Un + À avec À := — 


nm 
——. On en tire lim{v,| = +0 et donc limu, = a. 
Ua 


Un —2 
possibles a — 3—V13 et 5 — 3+VT8 et À > 1 donc limu, — 3—V13 sauf si Uo — P) ; 
Zn (une seule limite possible à = 1) ; uy11 — mt 
sont a = 1+ V2 et 5 = 1 — V2 mais À = —1 et la suite est périodique non convergente 
sauf si Up — @ OU B). 


On pourra vérifier cette théorie sur les exemples suivants : uy41 = (deux limites 


ui (les deux limites possibles 


Terminons par deux exemples où la limite possible est un point “faiblement” attracteur 
ou répulsif (i.e. la pente vaut 1) : 

Un+1 = Sin(un). En traçant le graphe on constate que la suite semble converger vers 
0; 


Prouvons cela. Le point clef est l’inégalité (classique mais démontré au chapitre 15) : 
0 < x <r/2 = 0 < sin(x) < x. Elle permet d'établir que la seule limite possible est 0 : 
d’autre part |u1| < 1 et si u — 0 la suite est constamment nulle ensuite donc on peut 
supposer 0 < u < 1 (le cas —1 < u < 0 se traite parallèlement en utilisant l’imparité 
de sin(x)) et en démontre alors que 0 < uy}1 = sin(un) < un < 1. La suite est donc 
décroissante et minorée donc convergente et la limite ne peut être que (0. 


Un+1 = Un + u3. La seule limite possible est 0 et le graphe semble indiquer que c’est 
un point répulsif. 


En fait si uo > 0 (on peut faire un raisonnement parallèle si uo < 0) alors u1 > üo et 
la suite u, est strictement croissante. Si u, était bornée, elle convergerait vers une limite 
finie et strictement positive, ce qui est absurde donc elle tend vers l'infini. 
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12.2.2 Suites linéaires récurrentes. 


Il s’agit des suites vérifiant une relation du type : 


(+) Un = aun-1 + bun-2 pour n >2 


On suppose que b Æ 0 sinon on est ramené à une suite géométrique. On vérifie im- 
médiatement que l’ensemble des suites vérifiant une telle relation donnée est un espace 
vectoriel (un sous-espace vectoriel de l’espace des suites) : en effet soit u, et v, deux telles 
suites, considérons Wy := Cün + dUn alors Wn = C(aun-1 + bun-2) + d(avn-1 + bun-2) = 
a(Cun-1 + dun-1) + b(Cun-2 + dun-2) = awn-1 + bwh-2. D'autre part les valeurs uo et ui 
déterminent entièrement le reste de la suite ; donc si v, est la suite obtenue avec v9 := 1 
et v1 := 0 et w, est la suite obtenue avec wo := 0 et wi := 1 on voit que ces deux suites 
forment une base de l’espace des suites vérifiant (*) (qui est donc de dimension 2) . On 
peut trouver une base plus explicitement de la façon suivante : considérons l’équation 
X?—aX —b = 0 (qui s'appelle l’équation caractéristique de la suite linéaire) et choisissons 
une racine @ alors la suite u,, := a” vérifie : 


2 aa —b) = 


Un — Aün—1 — Düun-2 = a" ?(a 
Distinguons donc deux cas : 

Cas n° 1 : Les deux racines a et 8 de X? — aX — b = 0 sont distinctes et alors une 
solution de (*) s'écrit u, = Aa” + uB” ; si l’on veut tout exprimer en terme de üo et ui 
on écrit le système : 

Ug = À+ y et ui = }a + ub 


d’où l’on tire À = 1 Puo 


5 tu g d'où: 


u1 — Pu QUo — U] 
PU MS Um 
Gb gp 


Cas n° 2 : Les deux racines de X? — aX — b — 0 sont confondues (disons égales à 
a) et donc a? — aa — b = 0 mais aussi aa + 2b = 0. La suite a” est encore une solution 
mais il faut en trouver une autre : on remarque alors que v, := na” vérifie la relation de 
récurrence linéaire (*) : 


Un — GUn-1 — bun-2 = 0 2(no? — a(n — 1)o — b(n—2)) = a" (aa + 2b) = 0 
Donc les deux suites a” et na” forment une base des suites vérifiant (*) ; toute suite u, 


vérifiant (*) s'écrit : 
Un = ÀQ° + una” 


ou encore en terme de wo et u1 on obtient : 
ui 
Un = U0Q7 + (= — wo) na” 
a 
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Bien entendu, dans chaque cas, il est facile, en général, d’étudier la convergence de la 
suite : elle dépend des modules des racines à, B ; le seul cas délicat est celui où [a] = |5|. 
Donnons quelques exemples : 

1) (Suite de Fibonacci) un = Un-1 + Un-2 

L’équation caractéristique e. _ 2__X-1—0et a pour racines & = LYS (connu 


comme le “nombre d’or”) et 5 = I-V5 et donc un = Aa” + 16" se comporte comme Àa” 
(si À £ 0) où V5À = u1 — Buo. oc. en tire limu, = +o si u1 > Puo et limuy = —0co si 
u1 < Buo. On observe aussi que (si u1 Z Buo) alors lim + = à. 

Par contre si u1 = Buo alors u, = 16” et limu, — 0. Tirn “Rte = 6, 


2) Considérons les suites vérifiant uy = Un-1 — Lun. 
L’équation caractéristique s'écrit X? — X + L = 0 et a pour racine double à = J. On 
en déduit u, = u927" + (2u1 — uo)n27" et donc limu, = 0 et lim “4 — . 


3) Considérons les suites vérifiant uy = Un_1 — Un_2. 


L'équation caractéristique s'écrit X? — X + 1 — 0 et a pour racines & — ns et 
B = à es: Observons que af — 86 — 1 donc la suite u, — Àa" + 18" vérifie Uuy16 = Un. 
La ile est donc périodique et elle n’est convergente que si elle est constante et nulle. 

4) Considérons les suites vérifiant u, = 2 cos(w)un_1 — Un-_2. 

L’équation caractéristique s'écrit X? — 2 cos(w)X +1 = 0 et a pour racines a = e“ et 
B=e "%, Siw/r € Z alors cos(w) = +1 et l'équation caractéristique a une racine double 
a = +1 donc uy = (uo + (+u1 — uo)n)(+1)". Siw/r & Z alors on écrit 


U —e un nn. CU —U 5m  —Uosin((n — 1)w) + uw sin(nw) 
2isin(w) 2isin(w) sin(w) 


Si w/r € Q on voit que la suite est périodique et non constante (puisqu'on a supposé 
w/r & Z) donc elle est bornée et non convergente. Si w/r &# Q la suite est encore bornée 
(facile) et non convergente (un peu plus délicat à prouver). 
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CHAPITRE 13 LIMITES ET CONTINUITÉ 


La notion de continuité est intimement liée aux propriétés des nombres réels (Cantor 
appelait le cardinal de R la puissance du continu). L'idée de la continuité est simple et 
peut se décrire de diverses façons imagées : “une fonction est continue si on peut tracer 
son graphe sans soulever le crayon du papier”, “le graphe de la fonction n’a pas de saut” 
ou encore “six se rapproche de xo alors f(x) se rapproche de f(xo). En particulier on 
doit avoir la propriété suivante : 


nr 0 + le jé) 


On remarquera que cette propriété est fausse pour des fonctions simples comme les fonc- 
tions “en escalier” : 


Tout comme la notion intuitive de limite, la notion de continuité est délicate à définir 
rigoureusement : la définition “epsilon-delta” donnée ci-dessous est due à Weierstrass et 
date donc du XIXe siècle. Voici une dernière approche avant la définition formelle : si 
l’on se donne un petit intervalle 1 centré en f(a) alors il existe un petit intervalle autour 
de a dont l’image par f est contenue dans I. Les définitions sont un peu arides et on aura 
intérêt à passer rapidement dessus jusqu'à arriver aux premières applications et revenir 
ensuite pour les approfondir. 


13.1 FONCTIONS CONTINUES 


Commençons par définir la notion de limite ou de “tendre vers” pour une fonction. 

Convention : dans tout ce chapitre on appellera constamment “intervalle” un “vrai” 
intervalle, c’est-à-dire un intervalle non vide et non réduit à un point (la plupart des 
énoncés seraient vides et sans intérêt pour des intervalles singleton). 


Définition: Soit f : 1 — R et xo un point de l'intervalle 7, on dit que f tend vers L 
quand x tend vers xo si 


Ve > 0, 6>0,0</[x- 7x0] <ô et el = |f(x)—-L<Ee 
On écrit alors 
nt, fé) =# 


LT — XO 


L'ÆT 


Remarques : 1) l’importance et la signification de prendre x Æ£ x0 sont éclairées par 
l'exemple suivant : on regarde f(x) := 1 si x 0 et f(0) := 2 alors 


im f@) =1%/(0) 


x — 0 


L£ 0 
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2) On peut définir de la même façon la limite d’une fonction à valeurs complexes et 
on montre alors facilement que comme pour les suites, lim f(x) = a + 4b si et seulement si 
lim Re(f(x)) = a et lim Im(f(x)) = b. 

3) On peut définir des variantes de la notion de limite en faisant tendre la variable 
vers l'infini ou la fonction elle-même : par exemple une fonction f(x) tends vers £ quand x 
tend vers l'infini si pour tout € > 0 il existe M > 0 tel que x > M entraîne |f(x) — {| <E&. 

4) Il faut remarquer que la limite d’une fonction, si elle existe, est unique. 


Définition: Une fonction f : 1 — R est continue au point x0 € I si 


Ve > 0, 0>0,xrelet [x — xol < 0 entraîne |f(x) — f(xo)| < €. 


Il revient au même d’imposer : 


lim f(x) = f(x) 


LT — XO 


L'ELO 
Une fonction est continue sur I si elle est continue en tout point de J. 


Remarque : à cause des quantificateurs, la définition ne change pas si on remplace les 
inégalités par des inégalités strictes, 1.e. si on écrit [x — xo| < Ô et/ou |f(x) — f(xo)l < €. 


Exemple : montrons directement à partir de la définition que la fonction f(x) = x? 


est continue sur R. 

Soit 0 € R et soit € > 0 ; si [x — ro! < 1 alors [x + ol < 2/|x0] + 1 donc si l’on choisit 
ô < min{1,e/(2|xo + 1)} et si [r — xo] < à on obtient |x? — xê] = [x + xol|x — xol < € ce 
qui prouve bien que la fonction x + x? est continue en %o. 


THÉORÈME: Soit f:1—R continue et soit x, € I ; silimx, = L et sil € I alors 
lim f(æn) = f(4): 


Démonstration: En effet soit € > 0 alors il existe Ô > 0 tel que x — £| < Ô entraîne 
f(x) — f(4)] <e (car f est continue en £) mais comme lim x, — 4, il existe no € N tel que 
sin > no alors |t» — {| < 0 donc | f(x) — f(£)| <E, ce qui est bien l’énoncé cherché. O 


Remarque : on peut montrer que si pour toute suite l’implication du théorème est 
vraie alors la fonction f est continue. 

On peut effectuer sur les limites de fonctions les mêmes opérations que sur les limites 
de suites (en fait si on prenait une définition plus abstraite on verrait qu’il s’agit du même 
concept). 


THÉORÈME: 1) Si T est un intervalle contenant x0 et si deux fonctions f,g:1—R 


vérifient : 
lim f(x) =£ et lim g(x) =! 
LT — XO LT > Lo 
A T À To 


alors on a les formules suivantes : 
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i) lim af(x) +bg(x) = al +bl 


LT — XO 
EL 
ii) lim f(x)g(x) = {L 
LT — Lo 
LE T0 
iii) Si {' Æ 0 alors lim f(x)/g(x) = L/L 
LT — XO 
HA = D 


Dans le cas où l’une de ces limites est infinie ces formules restent valables à condition 


d’appliquer les règles suivantes : 
+00 + 00 = +00 


+00 + a = +00 
—00 — 00 = —00 
—O00 + & — —00 
Si a > 0 alors a(+o) = +00 
si a < 0 alors a(+) = —c 


(+00).(+00) = +00 

(—oo).(—00) = +oo 

Si lim f(x) =0 mais f(x) £ 0 alors lim 
LT — XO 
2 


(resp. f(x) < 0) alors lim Fa = +00 (resp. = —0co). 


— +oo. De plus si en fait f(x) > 0 


2) Si 1,J sont deux intervalles contenant respectivement a,xo, si f : 1 — R et 
g:J—R vérifient g(J) C 1 (de sorte que f o g est bien définie) et : 


lim  g(x) 
LT — XO 


LL 


avec f est continue en a avec f(a) = L alors 


lim fog(x) 
LT > Lo 


LES 


= 


Démonstration: 1) (i) On utilise l'inégalité a f(x) + bg(x) — (al + bl')] < lal| f(x) — 


€ + 1bl1g(x) — €. 


(ii) Commençons par observer que si f tend vers £ quand x tend vers x, alors il existe 
un intervalle autour de x, sur lequel f est bornée. On conclut alors en utilisant l’inégalité 


Lf(æ)g(æ) — LT < |f(m)llg Ge) — LT +101 (æ) — 1. 


iii) On observe dans ce cas que |1/g(x)| < si x est suffisamment proche de %o 
iii) On ob d 1 <21101-1 t suffi t he d 


et on utilise la majoration Ès — £| < Ee |g(x) — £'| + mlf(æ) — l|. 
La démonstration des cas particuliers se fait par les mêmes méthodes et est laissée au 


lecteur. 
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2) Soit € > 0 alors il existe 0 > 0 tel que [y — a| < 6 entraîne |f(y) — {| < € mais par 
ailleurs il existe 7 > 0 tel que [x —x0| < n entraîne |g(x) —-a| < ô et donc |fog(x)—{| <Ee; 
ainsi f o g tend bien vers { quand x tend vers æo. D 


COROLLAIRE: Soient f,g:1 — deux fonctions continues alors : 
(i) f + g et fg sont continues. 
(ii) f/g et f © g sont continues sur chaque intervalle où elles sont définies. 


Démonstration: Immédiat à partir du théorème précédent en traduisant la continuité 
en terme de limites. Par exemple lim f og(x) = f(limg(x)) = fog(xo) (la première égalité 
à cause de la continuité de f, la seconde à cause de la continuité de g) ; ainsi f og est bien 
continue. [ 


Comme les fonctions constantes et la fonction identité x + x sont clairement contin- 
ues, on obtient immédiatement 


COROLLAIRE: Les fonctions polynômes sont continues, les fonctions rationnelles 
sont continues sur leurs intervalles de définition. 


Si l’on sait (voir chapitre 16) que les fonctions “valeur absolue”, e”, log x, cos(x),sin(x) 
sont continues, on en tire que toutes les fonctions que l’on fabrique à partir de celles-ci 
(par opérations et composition) sont continues là où elles sont définies. 


13.2 PROPRIÉTÉS DES FONCTIONS CONTINUES 


Les énoncés de ce paragraphe sont assez parlants mais les démonstrations sont rela- 
tivement délicates ; on pourra d’abord se concentrer sur l’application des résultats. 


THÉORÈME: (théorème des valeurs intermédiaires) Soit I — [a,b] un intervalle fermé 
et f: 1 — R une fonction continue ; si À est un réel compris entre f(a) et f(b) alors il 
existe c € Î tel que f(c) = À. En d’autres termes l’image d’un intervalle par une fonction 
continue est un intervalle. 


Démonstration: Supposons par exemple f(a) < f(b) et donc f(a) < À < f(b). 
Considérons l’ensemble E := {x € I | f(x) < À} ; c’est un ensemble borné non vide (il 
contient a) donc il admet une borne supérieure c := sup(Æ). Montrons que f(c) = À. Il 
existe une suite d'éléments x, de Æ tels que limx,, = c d’après les propriétés de la borne 
supérieure, par ailleurs f(x,) < À par définition de E. Comme f est continue en c on 
en tire : f(c) = limf(xh) < À ; Supposons f(c) < À et voyons que l’on aboutit à une 
contradiction. En effet il existerait alors € > 0 tel que f(c) +e€ < À et en utilisant de 
nouveau la continuité de f en c on obtient l’existence de 0 > 0 tel que |x — c| < Ô entraîne 
[f(x) — f(c)| < € et donc f(x) < f(c)+e < À. On conclurait que [c,c + 6[C E ce qui 
contredirait que c est la borne supérieure de E. 


121 


Graphiquement cela signifie qu’un graphe de fonction continue prenant des valeurs en 
dessous et au dessus d’une droite doit couper celle-ci en au moins un point. 


APPLICATION: Un polynôme P à coefficients réels de degré impair possède une 
racine réelle. En effet si a, est le coefficient du terme de plus haut degré n : 


lim P(x) =sgn(arjo et lim P(x) =(-1)"sgn(an)oo 
ZT — +00 ZT — —00 


donc il existe a avec P(a) < 0 et il existe b avec P(b) > 0 donc il existe c avec P(c) = 0 
d’après le théorème des valeurs intermédiaires. 


THÉORÈME: Soit I — [a,b] un intervalle fermé et f : I — R une fonction continue, 
alors : 

(i) f est bornée 

(ii) f atteint son minimum et son maximum, c'est-à-dire que : 


c € [a,b], f(c) = sup{f(x) | x € [a,b]} et dE [ab], f(c) = inf{f(x) | x € [a,b]} 


En particulier l’image d’un intervalle fermé par une application continue est un intervalle 
fermé. 


Démonstration:  (i) Considérons l’ensemble E := {x € Ja, b] | f est borné sur [a, x]}. 
Visiblement Æ est un intervalle et si c := sup(Æ) on à E = {a,c| ou [a,c] ; on veut donc 
prouver que c = bet que c € E. Montrons que c € E : comme f est continue en c il existe 
ô > 0 tel que f soit bornée sur [c — 6, c|, mais c — 8 € E donc f est bornée sur [a, c — à] 
également et donc sur {a, c|. 

Supposons maintenant c < b, la continuité de f en c entraîne qu’il existe un intervalle 
[c—0,c+0] € Ja, b] sur lequel f est bornée et donc comme précédemment on peut conclure 
que f est bornée sur [a,c+6], donc c+ô € E ce qui contredit que c est la borne supérieure 
de E. 

(Gi) Posons M := sup,cuu f(x). On définit une suite d’intervalles emboités 6 := 
[a, b], ...,1, := lan, b,] de sorte que à chaque pas /,+1 soit égal soit à [a», (an +b,)/2] soit 
à [(an +b»)/2,b,] et tel que sup,er, f(x) = M. On choisit c € NI, (cette intersection est 
non vide d’après la propriété des segments emboités) et on utilise la continuité de f en c 
pour conclure que pour tout € > 0, il existe n tel que x € 1, entraîne | f(x) — f(c)| < e/2. 
Par ailleurs, comme sup,er, f(x) = M, il existe x € I, tel que f(x) > M — e/2 donc 
finalement M > f(c) > M —e. Ceci étant valable pour tout £ > 0 on conclut bien que 
Fe) = M: 0 


Remarquons que la conclusion peut être fausse si f n’est pas continue ou si l’intervalle 
n’est pas borné. Par exemple f(x) = 1/x n’est pas bornée sur ]0,1] et n’atteint pas son 
minimum sur [1, +00). 
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THÉORÈME: Soit f une fonction continue strictement croissante sur un intervalle 
d’extrémités a et b. Supposons que 


Hi. JG ee fr ‘in, Jr =6 
T—a x — b 
x>a x <b 


Alors f détermine une bijection de l’intervalle d’extrémités a et b vers l'intervalle d’extré- 
mités «a et f et la bijection réciproque est également continue et croissante. 


Remarque : en particulier si f est continue et croissante sur Î contenant [a, b] alors 


f(la, b]) = [f(a), f()]. 


Démonstration: Comme x < y entraîne f(x) < f(y), la fonction f est injective. 
Soit y €la, 5] alors il existe x1 €l]a, b[ tel que f(x1) < y et il existe x2 €la, b| tel que 
f(x2) > y donc, d’après le théorème des valeurs intermédiaires, il existe c €]x1, x2[ tel que 
f(c) = y. Ainsi f est surjective et définit une bijection de ]a, b[ sur ]a, B[. Voyons que f71 
est croissante et continue. Si x < y et f !(x) > f-l(y), on aurait alors x = f(f-l(x)) > 
(FT (y)) = y ce qui est contradictoire. Choisissons maintenant yo €la, 3] et montrons 
que f est continue en yo. Soit donc € > O, on sait que yo = f(x0) avec xo Ela, b] et on peut 
choisir a/,b" E]a, b] tels que 0 — € < a! < x0 < db < ro + €. On sait que si a’ := f(a’) et 
B':= f(b') alors f(]a’,b'!) =]a’, B'[ et donc que si y €la’, B'[ alors f—!(y) Ela’,b'[ et donc 
|f(y) — f(yo)l < € ; ce qui montre que f-! est continue en yo. D 


Remarque : on obtient ainsi des bijections de {a, b] vers [a, 5] ou de Ja, b] vers ]a, 5] 
etc. 


On exploitera au chapitre 16 ce théorème pour définir les fonctions exponentielle 
(comme fonction réciproque du logarithme), Arcsin, Arcos, Arctg, Argsh, Argch et Argth. 
Donnons ici un exemple de construction de fonction réciproque : Soit la fonction f(x) := 
xæ+xlog(x) ; on vérifie aisément qu’elle est strictement croissante sur [1,+oco) (en effet log 
est croissante et positive sur [1, +c) donc x > y entraîne 1 +log(x) > 1+log(y) > 1 donc 
æ(1 +log(x)) > y(1+log(y))). Ainsi f définit une bijection de [1,+o0) sur [1,+co) ; pour 
tracer le graphe de la fonction g — f-! on prend simplement le symétrique du graphe de 
f par rapport à la droite y = x. 


13.3 LIMITES DE FONCTIONS 


On entame ici l’étude de quelques techniques de calculs de limites qui seront beaucoup 
plus développées au chapitre 19 (développements limités). 
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Définition: Soient deux fonctions f et g définies sur un intervalle 7 ; elles sont 
équivalentes au voisinage de xo € Î (resp. de +oo) si 


lim (f(x)/g(x)) = lim (g(x)/f(x)) =1 


T— To T— TO 


On écrit alors f(x) + g(x) en sous-entendant le point où f et g sont équivalentes. 


Commentaire : l’idée d’un équivalent est simple : dire que f(x) = 1 quand x tend 
vers 0, équivaut à dire que lim f(x) = 1 mais f(x) + x entraîne et est beaucoup plus précis 
que lim f(x) = 0 : cela dit avec quelle vitesse f(x) tend vers zéro (par exemple moins vite 


que æ? mais plus vite que x). 


Exemples : On verra au chapitre 16 une démonstration géométrique du fait suivant : 
sin(x) — x lorsque x tend vers 0 ; de même cos(x) — 1 + x?/2. 

Soit FE) := gi tuten une fraction rationnelle (avec amby # 0), alors lorsque x 
tend vers +oo on a F(x) + #77 *. En effet 


FREE (a +... + 20) / (bn +... + do) tend bien vers an/bn. 


Remarque : Il ne faut pas confondre f(x) + g(x) + h(x) et f(x) — g(x) = h(x) ; 
par exemple si f(x) = 2x? + x, g(x) = 2x? et h(x) = 1 alors f(x) — g(x) + h(x) mais 
f(x)—-g(x) = x 4 h(x) quand x tend vers l'infini. Parmi les autres pièges à éviter, signalons 
aussi que f(x) + g(x) n’entraîne pas ho f + ho f(x), même si h est continue ; en effet en 
choissant f et g comme dans l’exemple précédent et k — exp on a ho f(x)/ho g(x) = e” 
qui ne tend pas vers 1 (quand x tend vers l'infini). 


On ne peut pas donc en général ajouter des équivalents mais on peut les multiplier : 


PROPOSITION: Supposons que f(x) = g(x) et h(x) = k(x) quand x tend vers a 
alors f(x)h(x) = g(x)k(x) quand x tend vers a. 


Démonstration: En effet, si lim (42) = Let lion (22) = 1 alors lim (rte 
[ 


> 
= 
8 
RE 
De 
Il 
= 


Exemple : lorsque x tend vers l'infini exp(x — 1/x) = exp(x) et x" +... + ao © x 
donc (x +... + ao)exp(x — 1/x) = x'exp(x). 


PROPOSITION: (prolongement par continuité) Soit c € [a,b] et f : [a,b] \ {ch —R 
une fonction continue et supposons que lim f(x) = £. Alors la fonction f : [a,b] — R 


x — CC 
LA 
définie par 
ss mil) SLT GC 
AS { L STE 
est continue. 
Démonstration: Le seul problème est bien sûr la continuité en c mais on à par 
hypothèse : lim f(x) = {= f(c) donc f est continue en c. O 
x — C 
LAC 
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Exemples : La fonction f(x) = sin(x)/x (si x 0) et f(0) = 1 est continue. 
La fonction g(x) = (1 — cos(x))/x? (si x 4 0) et g(0) = 1/2 est continue. 
La fonction h(x) = sin(x)/x (si x 0) et h(0) = 1 est continue. 

La fonction k&(x) = exp(—1/x°?) (si x 4 0) et k(0) = 0 est continue. 


URLS SSSR SS LS SSL SSL SSL SSI ST 


$ \ 
4 "#4" € 
Ê 2504 | 
ê CO AHA FOXAENHR LES 
ê BEAHKOrO $ 
ù MATEMATHKA, $ 
4 AKAAEMHKA | 
É £ è 
€ 4 
Fa " 
4 ê 
? PS. — 006 > 
s [1707=17831 4 
ê LR NN 1 


NL NL do LL RL me 


Euler Leonhard (1707-1783) 


125 


CHAPITRE 14 DÉRIVÉES ET FORMULE DE TAYLOR 


Vous connaïissez déjà la notion de dérivée d’une fonction (en un point) dont nous 
rappelons néanmoins ci-dessous la définition ainsi que l’interprétation géométrique : la 
tangente à une courbe en un point (quand elle existe) est la droite qui “épouse” le mieux 
possible la forme de la courbe en ce point ; la dérivée d’une fonction f est la pente de 
la tangente à la courbe d’équation y — f(x). Il est assez facile de voir que la dérivée 
d’une fonction croissante est positive, mais la réciproque qui est délicate et généralement 
admise en terminale est démontrée ici. Pour étudier plus finement une courbe, après avoir 
déterminé sa tangente en un point on peut chercher quel est le cercle ou la parabole qui 
l’approche le mieux ; on peut aussi vouloir savoir si le point est un point d’inflexion — la 
courbe traverse-t-elle sa tangente en ce point? — ou si la fonction atteint en un point un 
maximum où un minimum. La réponse à toutes ces questions est donnée par la formule 
de Taylor, qui grosso modo décrit la courbe y — f(x) près du point xo en fonction de ses 
dérivées successives en xo. 


14.1 RAPPELS SUR LE CALCUL DES DÉRIVÉES 


Comme au chapitre précédent nous prenons comme convention que les intervalles sont 
des intervalles non vides et non réduits à un point. 


Définition: Soit 7 un intervalle réel ouvert et x0 € I, soit f : 1 — R une fonction à 
valeurs réelles ; on dit que f est dérivable en x9 si la limite 


im  {@)-f(#0) 
T—X0 
LT — XO 
LÉO 
existe et dans ce cas cette limite s'appelle la dérivée de f en x0 et se note f’(x0) ou  (xo). 


Si f est dérivable en tout point, la fonction x + f'(x) ainsi définie s’appelle la fonction 
dérivée. Si f’ est elle même dérivable, sa dérivée s’appelle la dérivée seconde de f et se 
note f” ou f(2). On définit de même la dérivée n-ième (si elle existe, on la note f(") ou 
d"f 


nn) par la relation de récurrence 


FO) = 1), 10) = Fa), 100 (2) = (400) (a) 


Exemples : Une fonction qui n’est pas continue en un point x0 n’est pas dérivable ; 
la fonction f(x) := |x| est continue au point xo := 0 mais n’y est pas dérivable (en effet 
la limite de |x|/x en restreignant x à être positif est +1 alors qu’en restreignant x à être 
négatif la limite est —1). 

Calculons directement à partir de la définition la dérivée de f(x) := 3x° — 5x +4 en 
ZTo=l:ona f@)- F0) : or — 3x — 2 et donc 


T— 


fD= lim ED = lim 3r-2—1 
x — 1] am 
EE 
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Pour calculer les dérivées successives on calcule plus généralement f’(x0) = 6x0 — 5 puis 
f"(xo) = 6 puis f(x) = 0 pour n > 3. 

Interprétation : Si l’on trace la courbe y = f(x) la dérivée f'(x0) s’interprète comme 
la pente de la droite tangente au point de coordonnées (x0, f(xo)) à la courbe. 


L’équation de la tangente est : 


y — f(xo) = f'(xo)(x — x) 


On peut aussi écrire la définition de la dérivée sous la forme d’un “développement limité 
à l’ordre 1” (voir le chapitre 19) : 


f(xo + h) = f(xo) + f'(xo)h + E(h}h 


avec limp_0 E(h) = 0. 

Sous cette forme il est clair qu’une fonction dérivable en x est continue en xo 
puisqu’alors limy_0 f(xo + h) = f(xo). Une autre façon de dire que f est dérivable en 0 
est de dire que la fonction g(x) := ——— peut être prolongée par continuité en x, en 
lui donnant la valeur g(xo) = f'(xo). 

Variantes : 

1) Il est parfois utile de définir la notion de dérivée à droite notée f(x0) (resp. à 


gauche notée f/(x0)) d’une fonction en un point x : 


T — Lo T > XO 
T > XO T < TX 


Par exemple si f(x) = [x] alors f,(0) = 1 et f{(0) = —1. Une fonction est dérivable 
en xo si et seulement si elle est dérivable à droite et à gauche et ces deux dérivées sont 
égales. 

2) Dans le cas où la limite de cie vaut £oo, on ne considère pas la fonction 
dérivable mais on peut parler de tangente verticale : c’est le cas par exemple de la fonction 
f(x) := Ÿ/x au point xo = 0 : 


3) Parfois une autre notation pour le calcul des dérivées est utile ; on aurait pu définir 
la dérivée en x0 de f comme 


f'(xo) = re fGo+h)—f (0) 
h — 0 
h£O 
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Révisons rapidement les règles principales de calcul des dérivées : 


THÉORÈME: Supposons f et g dérivables, alors f + g et fg sont dérivables, f/g et 
go f sont dérivables là où elles sont définies ; si f est une bijection et f'(x) Z 0 alors f-! 
est dérivable en x. De plus on à les règles de calcul suivantes 

(i) (dérivée d’une somme) (f + g)' = f' + g' 

(ii) (dérivée d’un produit) (fg) = f'g + fg' 

! LÀ ! 

(iii) (dérivée d’un quotient) (4) - EE 

(iv) (dérivée d’une fonction composée) (g o f)! = f'.g'o f 

(v) (dérivée d’une fonction réciproque) Si f admet une bijection réciproque, si yo — 
f(&o) (et donc #0 = f7 (yo)) et si f'(xo) À 0 alors GE (Yo) = FE 


Démonstration:  Laissons au lecteur le soin de réviser les trois premières formules et 
démontrons les deux dernières qui sont plus délicates. 

(iv) Posons f(xo) — Yo et g(Yo) — Zo, d’après les hypothèses f(x) — yo — (x — 
to)(f'(to) + E1(x — to)) et g(y) — 0 = (y — yo)(g'(yo) + Ea(y — Yo)) avec lims_,0 €1(R) = 
limp_0€2(h) = 0. En remplaçant y par f(x), on en tire 


go f(x) — 20 =(f(x) — yo)(g' (yo) + E2( f(x) — yo) 
=(x — %0)(f'(xo) + €1(x — xo))(g/ (yo) + 2 ((x — xo)(F' (to) + E1(x — xo))) 
=(x — 10) f'(xo)g'(yo) + (x — ro)n(x — to) 


Il reste à vérifier que limz_,0 9(h) = 0 et on aura donc bien montré que go f est dérivable 
et que (go f)(xo) = f'(xo)g' (yo). Or quand x tend vers xo, la quantité f’(x0) +€1(x — to) 
tend vers f’(xo) et donc (x — xo)(f'(xo) + €1(x — to)) tend vers 0 et donc €2 de cette 
dernière quantité tend bien vers 0. 

(v) Par hypothèse f(x) — yo = (x — xo)(f'(xo) + Ex — xo)) avec limn_oe(h) = 0 ; 
comme f'(xo) Z 0 on sait que si [x — xo] est très petit alors [e(x — xo)| < |f'(xo)| et 
f'(xo) + E(x — xo) À 0 et on peut alors écrire : 

T — ZX 1 


f(x) — f(xo) f(x) + Ex — vo) 


Changeons de notation et appelons g(y) = f-!(y) = x ; l'égalité précédente peut se 
réécrire : 


g(y) — g(yo) | 


y—yo  f'(r0o) +e(g(y) — g(yo)) 


or limy-_y E(g(y) — g(yo)) = 0 puisque g est continue et limy_,0€(h) = 0 donc on obtient 


bien que g = f! est dérivable et que g'(yo) = FES 0 


Ces règles, jointes à la connaissance de quelques dérivées permettent de calculer toutes 
les dérivées “usuelles” (voir le chapitre 16 pour des révisions et compléments concernant 
les fonctions usuelles). 


THÉORÈME: (calcul de dérivée de fonctions usuelles) Les formules suivantes sont 
valables 
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(x) = nx"-! pour n € N et plus généralement (six E R* eta€ R)on(x*) = ax! 

(toglx|) = + 

(e*)' —= e® 

(sin(x))' = cos(x) et (cos(x))’ = —sin(x) 
Démonstration: La première formule s'obtient, en faisant une récurrence sur n et 
en utilisant la dérivée d’un produit : si (xæ"} = nx°-1 alors (x*1} = (xx) = g° + 
ænx"l = (n +1)". Par définition on a x® := etle(x), en appliquant les deuxième et 


troisième formules et la règle de dérivation de fonctions composées on obtient : (2%) — 


(alog(x))'et 28) = ax 1, 

Nous réviserons dans le chapitre 16 (sur les “fonctions usuelles”) le fait que, par 
construction, Vx € R*,(logx) = 1. Si maintenant x € R* alors log|x| = log(—x) et en 
utilisant la règle de calcul des dérivées de fonctions composées on obtient bien (log|x|)' — 

si 1 
DE l’exponentielle est la fonction réciproque du logarithme, la règle (v) du théo- 
rème précédent permet de calculer en posant yo = log xo, f(x) = log x et g(y) = e* : 


; À 
9 (yo) . f' 


— BA) —= e?° 
to) 


Pour calculer la dérivée de la fonction sinus admettons provisoirement la formule suivante, 
qui sera démontrée par un argument géométrique au chapitre 16 : 


lim nt =] 

h — 0 

hZ£0 
De la relation cos?(h) — 1 — —sin?(h) on tire 

cos(h) —1  cos’(h)—1 1 __ fsin(h) h 
h È h cos(h) +1 h cos(h) + 1 

et donc cos(h)=1 tend vers 0 quand h tend vers 0. On peut utiliser cela pour exprimer 
ainsi : 


sin(x +h)—sin(x)  sin(x) cos(h) + cos(x) sin(h) — sin(x) 
h h 


= cos(r) (+) + sin x (LR — :) | 


Siaie dim sin(x + D — sin(x) 


d’où l’on tire 


= cos(x). 


Le calcul pour la fonction cosinus est similaire et laissé au lecteur. TI 


Exemples de calculs : 
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Soit f(x) = (ecos(æ) + i) et posons comme au deuxième chapitre k(x) := cos(x), 
h(x) := e* et g(x) := (x + 1)° de sorte que f = gohok. En appliquant deux fois la 
règle de dérivation de fonctions composées on obtient : f/(x) = (ho k)'(x)g'(h o k(x)) — 
k'(x)h'(k(x))g'(h o k(x)) ; par ailleurs k'(x) = —sin(x), h'(x) = e* et g'(x) = 3(x +1)? 
d’où f'(x) = —3sin(x)es(®) (Er + 1). 

Prenons maintenant f(x) = (cos(24/x + 1) + e%*)/(tg(x?) + 4x + 1)*. Pour calculer 
la dérivée de f on la décompose : f = uv * avec u := cos(2,4/x + 1) + e% et v :— 
tg(x?) + 4x + 1 ; la règle de dérivation d’un quotient jointe à celle d’une puissance donne 


f!' = (uv — 3uv')v *. Pour calculer u’ posons g(x) := 24/x + 1 alors g'(x) — Ne et 


(cos(g(x))" = —g'(x)sin(g(x)) = 7 sin (2x + 1) et enfin uw — 7 sin (24% + 1) + 
8e*%*. D'autre part (tg(x}}’ = (sin(x)/cos(x)})’ — 1/cos?{x) donc (tg(x°))' — 2x/cos°(x) 
et v' = 4+2x/cos?(x). 


APPLICATION: on peut déduire du théorème les règles suivantes : 
(i) (dérivée d’une puissance) (u")’ = nu!'u"! 
(ii) (dérivée “logarithmique” d’un produit) si vu = u;"'...ur" alors U = ma +...+ 


#: 
Uu 


Mr Le 
(iii) la dérivée d’une fonction de période T (ï.e. telle que f(x + T) = f(x)) est encore 
périodique de période T'. 


(iv) la dérivée d’une fonction paire (resp. impaire) est impaire (resp. paire). 


Démonstration: (i) on applique la formule de dérivée d’une fonction composée à fou 
où JT) = TE 


(ii) Faisons le calcul lorsque v — uju2 et laissons au lecteur le soin d'écrire une 
démonstration par récurrence pour le cas général. w = __ a _ de =. 

(ii) Posons g(x) = x +T alors f — foget donc f’(x) = (fog)'(x) — f(g(x))g' (x) = 
F'(x+T). 


(iv) Supposons f(—x) = Ef(x) (avec € — +1) et posons i(x) — —x alors (f oi)'(x) — 
ef'(x) = f'(i(x))i (x) = —f(-x) d'où l'énoncé. D 


Le calcul de la dérivée n-ième d’une fonction ne pose pas plus de problème théorique 
mais peut être difficile à mener dans la pratique. En fait il est souvent intéressant seulement 
de savoir qu’une fonction possède une dérivée d’un certain ordre. 


Définition: Un fonction f :ja,b[— R est n fois continûment dérivable ou de classe 
C” si elle possède des dérivées continues jusqu’à l’ordre n. Un fonction f :la,b[— R est 
indéfiniment dérivable ou de classe C® si elle possède des dérivées à tout ordre. 


Exemples : Les fonctions polynômes, exponentielles, logarithmes etc sont C® de même 
que les fonctions “compliquées” dont on a calculé la première dérivée (pour la preuve, il 
suffit de formuler convenablement une récurrence). La fonction |x| est seulement de classe 
C°, c’est-à-dire continue. La fonction définie par : 


f(0):=0 et fa) = asin (2) six Z0 
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est continue et dérivable ; en effet f’(0) = lim, _oæsin (+2) = 0 et si x £ 0 on a f’(x) = 


2x sin (1) — COS (2). Toutefois f’(x) n’est pas continue en 0 puisque cos (+) n’a pas de 


limite quand x tend vers 0. Cette fonction n’est donc pas de classe C! sur R. 


Voici une formule bien utile donnant la dérivée n-ième d’un produit : 


THÉORÈME: (formule de Leibniz) Soient f et g deux fonctions n fois dérivables, alors 
le produit fg est n fois dérivable et la dérivée n-ième est donnée par la formule : 


Co beD Carrt 


i=0 


Démonstration: La preuve se fait bien sûr par récurrence sur l’entier n. Pour n = 0 
la formule dit que fg = fg, pour n = 1 la formule dit que (fg)' = fg! + f'g, ce que l’on 
sait déjà. Supposons donc la formule vrai pour n — 1 et déduisons-en la formule pour n. 
Donc on suppose 


n—1 
COTE NS OS 
i=0 


on en déduit que (fg)(") = (ge) vaut 


n—1 n—1l 
3 Ci, CE es) + Fee) = fgt) + > FO gr) (os je ci-i) + FO) g 
i=0 


j=i 


or d’après la règle du triangle de Pascal C_, + C7 = CŸ ce qui donne la formule de 
Leibniz pour n. D 
14.2 THÉORÈME DES ACCROISSEMENTS FINIS, FORMULE DE TAYLOR 


Commençons par une propriété simple des points où une fonction atteint un maximum 
(ou un minimum) : 


THÉORÈME: Soit f :ja,b[— R une fonction qui atteint un maximum (ou minimum) 
en To ; si f est dérivable en to, alors f'(xo) = 0. 


Démonstration: Supposons que f atteigne un maximum en c (le raisonnement est 
analogue si c’est un minimum) ; si x > c alors G@)-F(e) < 0 et donc 


f()= lim À <0 


de même si x < c alors @)- fKe) > 0 et donc 


f(o= lim À >5 


et on peut conclure que f'(c) =0. D 


Le lemme qui suit est géométriquement assez intuitif : 


LEMME:  (Lemme de Rolle) Soit f : [a,b] — R une fonction continue sur [a,b] et 
dérivable sur ]a, b| telle que f(a) = f(b) = 0, alors il existe c €]a, b tel que f'(c) = 0. 


Démonstration: Si f est constamment nulle, la conclusion est évidente, sinon on à 
l'inégalité sup,eta y |f(x)| > 0 et de plus d’après un théorème du chapitre précédent cette 
borne supérieure est atteinte en un point c (nécessairement distinct de a et b). Il existe 
donc c Eja, b] tel que ou bien Vx € [ab], f(x) < f(c) ou bien Vx € [a,b], f(x) > f(c). 
D’après le théorème précédent on doit avoir f’(c) =0. D 


Nous pouvons maintenant démontrer le théorème des accroïissements finis 


THÉORÈME: (théorème des accroissements finis) Soit f : [a,b] — R une fonction 
continue sur [a, b] et dérivable sur Ja, b[ alors : 

(1ère forme) Il existe c €]a, b| tel que f(b) — f(a) = f'(c)(b — a). 

(2ème forme) Supposons de plus la fonction dérivée bornée sur ]a, b[ et posons M := 
supacjaulf"(æ)l alors |F(0) — F(a)| < Mb - al 


Démonstration: L'idée est de modifier la fonction f par une fonction linéaire de 
sorte que l’on puisse lui appliquer le lemme de Rolle. Considérons la fonction g(x) :— 
(b — a) f(x) + (f(a) — f(b))x + af(b) — bf(a) alors g est bien continue et dérivable avec 
g'(x) = (b—-a)f'(x)+ f(a)— f(b). Par ailleurs par construction g(b) = (b—a)f(b)+(f(a) — 
f(b))b+af(b) —bf(a) = 0 et g(a) = (b—a)f(a) +(f(a) — f(b))a + af(b) —bf(a) = 0 donc 
il existe c €lJa, b tel que g'(c) = (b — a)f'(c) + f(a) — f(b) = 0 ce qui donne la première 
partie de l’énoncé. La deuxième est claire en notant que |f’(c)| < M. D 


Commentaire. Bien que la deuxième forme du théorème soit moins précise, c’est la plus 
utile : c’est celle qui se généralise aux fonctions de plusieurs variables. C’est cet énoncé qui 
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permet de calculer sur ordinateur une valeur approchée du minimum (ou maximum) d’une 
fonction sur un intervalle, à condition que la fonction dérivable et qu’on sache controler sa 
dérivée. 


COROLLAIRE: Soit f : [a,b] — R une fonction continue sur [a, b] et dérivable sur 
Ja, dl ; 

La fonction f est constante si et seulement si f' = 0 

La fonction f est croissante (resp. décroissante) si et seulement si f" > 0 (resp. f' < 0) 

De plus si f" > 0 (resp. f' < 0) alors f est strictement croissante (resp. strictement 
décroissante). 


Démonstration: Il est clair que si f est constante alors f” = 0 ; réciproquement 
supposons f” — 0 alors pour tout x EJa,b], le théorème des accroissements finis donne 
l'existence d’un c €]a, x] tel que f(x) — f(a) = (x — a)f'(c) = 0 donc f(x) = f(a) est bien 
constante. 

Si f est croissante alors le rapport Li est toujours positif, donc la limite quand 
x tend vers x (si elle existe) est positive. Réciproquement supposons que pour c €ja, b| 
on ait f'(c) > 0 ; si a < x < y < b alors le théorème des accroissements finis appliqué 
à l'intervalle [x,y] donne f(y) — f(x) = (y — x)f'(c) > 0 (et si f’(c) > 0 on à même 
f(y) — f(x) > 0) d’où le résultat. Le raisonnement est bien sûr identique pour les fonctions 
décroissantes. D 


On a vu (Cf Chapitre 6) que si f(x) est une fonction polynôme de degré < n alors : 


fi (a) 


n! 


(a) 
2! 


f() = f(a) + f'(a)(b — a) + (b— a)? +...+ 


@—a)" 


Bien sûr une telle formule ne peut être exacte si f n’est pas un polynôme mais il est 
raisonnable de penser qu’elle donne une bonne approximation de la fonction f au voisinage 
du point a ; c’est le contenu de l’énoncé suivant : 


THÉORÈME: (Formule de Taylor-Lagrange) Soit f : [a,b] — R une fonction continue 
sur [a,b] et n +1 fois dérivable sur ]a, b[ alors il existe c ja, b| tel que 


f”(a) 


(#1) ( 
FE) = fe) + Ga) + LOG a +….+ …., F0+0(0) 


(b — a) + He DEN = are 


fa) 


n! 


Si l’on suppose de plus que |f("*1)| est bornée par disons M alors on en déduit 


| TOP CO NE 
FO - 10 -ro6-0- Leo. Gone EE - a+ 


Démonstration: Considérons la fonction g(x) := f(x) — f(b) +31; Ge) FO (x) alors 
un calcul simple montre que g'(x) = f (+1) (9) En, Choisissons maintenant À tel que 


la fonction A(x) := g(x) + A G=2 "7 


Gnr S’annule en x = a. Comme on à h(a) = h(b) = 0, le 
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lemme de Rolle garantit l'existence de c €Ja, b] tel que 0 = h'(c) = Er” (FU D) — À) = 
0. En reportant À = f(#1){c) dans l'équation h(a) = 0 on obtient la formule de Taylor. 
La deuxième affirmation est claire à partir de la formule. 


Par exemple cette formule appliquée à b = 1, a =0 et f(x) := e*” donne : 


se 
Du 12 "nl (n+1)! 


_—— ; 1 1 1 
et donc en particulier lim | 1+ — + 3I lé 
! n! 


n—00 1! 


14.3 EXTREMA D'UNE FONCTION 


Calculer le tableau de variation d’une fonction et ses minima et maxima est une des 
utilisations les plus fréquentes du calcul différentiel ; on en donne ici quelques exemples. 


Nous avons vu qu’une condition nécessaire pour qu’une fonction dérivable ait un 
maximum sur un intervalle ouvert est que sa dérivée s’annule en un point. Ce n’est 
clairement pas suffisant comme le montre l’exemple de f(x) = x° dont la dérivée s’annule 
en zéro mais qui est croissante. La formule de Taylor permet d’établir des conditions 
suffisantes lorsque la fonction est suffisamment de fois dérivable. 


THÉORÈME: Soit une fonction f Ja, b[— R qui est n + 1 fois continûment dérivable 
et soit ro €]a, b| ; supposons que f'(xo) =... = f-1(x9) = 0 et f(x0) Z 0 alors 

(i) Sin est impair, f ne possède ni maximum ni minimum en c. 

(ii) si n est pair alors il existe un intervalle ]x0 — €,x0 + e[C]a, b[ sur lequel f admet 
f(æo) comme maximum si f()(x0) < 0 (resp. minimum si f(x) > 0). 


Démonstration: C’est une application directe de la formule de Taylor : d’après les 
hypothèses on peut écrire f(x) — f(xo) = (x — xo)" (FM (x0) + (x — to) FFM (c)) (où € 
dépend de x). Comme f(®+1)(x) est continue, elle est bornée sur un intervalle autour de 
zo et donc si |r — x0| est assez petit f()(x0) + (x — 0) fl (c) est du même signe que 
F9 (xo) et bien sûr (x — x)" est positif si n est pair et du signe de (x — xo) si n est 
impair ; ainsi le signe de f(x) — f(xo), quand x est dans un petit intervalle autour de xo, 
est comme annoncé dans le théorème. D 


Remarquons que la conclusion du théorème n’est pas que le maximum (ou minimum) 
sur tout l'intervalle ]a, b[ de la fonction f est atteint mais seulement que f atteint en xo 
son maximum (ou minimum) sur un (petit) intervalle autour de xo. On dit que f admet 
un maximum (ou minimum) local. 

On peut illustrer ce théorème par le diagramme suivant : 

CAS n impair : 

F0) (xo) > 0 F0) (0) > 0 


134 


CAS n pair et f()(xo) < 0 : 


CAS n pair et f()(xo) > 0 


COROLLAIRE: Soit f une fonction continue de [a, b] vers R, dérivable sur a, b|, alors 
f atteint son maximum (resp. son minimum) soit en a ou b, soit en un point c €]a, b[ où 


(ce) = 0 
Démonstration: On sait que f atteint ses extrema, si ce n’est pas en a ou b, d’après 
un théorème du paragraphe précédent, cela doit être en un point où f’ s’annule. O 


Terminons par l’étude de la position d’une courbe y = f(x) par rapport à sa tangente. 


Définition: Une courbe y = f(x) possède un point d’inflexion en xo si la courbe est 
situé de part et d’autre de sa tangente au voisinage de x. 


Exemple (en xo = 0) : 


Point d’inflexion f(x) = x° +x Pas d’inflexion f(x) = 2*+x 


Avec les mêmes méthodes ou en appliquant le théorème précédent à g(x) := f(x) — 
f(xo) — f'(xo)(x — xo) on démontre facilement la caractérisation suivante : 


APPLICATION:  (i) Supposons que f soit deux fois dérivable, alors si f a un point 
d’inflexion en x, on a f”(xo) = 0. 

(ii) Supposons que f soit n fois dérivable, f"'(x0) =... = f-1{(x0) = 0 et f((x0) 
0 alors x, est un point d’inflexion si et seulement si n est impair. 


Ÿ 


Leibniz Wilhelm Gotfried (1646-1716) 


EN] 
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CHAPITRE 15 INTÉGRATION 


L'objet de ce chapitre est le calcul des aires. Plus précisément on voit assez facilement 
que, en découpant les aires, on se ramène à savoir calculer les aires délimitées par deux 
axes verticaux, un axe horizontal et le graphe d’une fonction : 


Il existe deux cas où le résultat est très simple à trouver : celui où la fonction est 
constante (un rectangle), celui où la fonction est linéaire (un trapèze) : 


J(æ) = c f(x) = ux +v 
A = (b — a)c A=(b—a) (eeo rare) = Sub? + bu — Jua? — av 


On peut dès à présent observer que l’aire, vue comme fonction de b est une fonction 
dérivable dont la dérivée dans le premier cas est À" — c = f(b) et dans le second cas 
A! = ub+v — f(b). Ce phénomène est général et constitue le théorème fondamental du 
calcul intégral, découvert par Newton. Avant de démontrer ce théorème il faut construire 
la théorie de l'intégration — du calcul d’aires- disons pour les fonctions continues. L'idée 
est assez simple : on approche toute fonction par des fonctions “en escalier”, c’est-à-dire 
qu’on approche une surface par une somme de rectangle ; on prend un découpage de plus en 
plus fin et le résultat à la limite est l’aire cherchée. Ce programme comporte des difficultés 
techniques mais est essentiellement correct. En particulier Archimède est le premier à 
l’avoir utilisé et ses calculs d’aires délimitées par des arcs de cercles, des arcs de paraboles 
doivent être vus comme les premiers éléments du calcul intégral. 


15.1 INTÉGRATION DES FONCTIONS CONTINUES. 
Commençons par définir précisément les fonctions en escalier : 


Définition: Une fonction f : [a,b] — R est une fonction en escalier si il existe une 
subdivision de l'intervalle [a,b] par a = ag < a1 < a2 < ... < an = b telle que f soit 
constante sur chaque intervalle ]a;, a;+1|. 


Exemple : la fonction E(x) “partie entière” est une fonction en escalier sur tout 
intervalle de R. 

Remarque : L'avantage des fonctions en escalier est qu’il est facile de calculer l’aire 
qu’elles délimitent. En effet si f(x) = c; pour x Ela;,a;41| alors l’aire est donnée par le 
nombre 


S(f) := | Ci(ai+1 — @i) 
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à condition de compter positivement l’aire située au dessus de l’axe des x et négativement 
celle qui est située au dessous. 


Comme nous voulons approcher les fonctions continues par des fonctions en escalier, il 
est commode d'introduire une classe de fonctions qui contient les deux types de fonctions : 


Définition: Une fonction f : [a,b] — R est une fonction continue par morceaux si il 
existe une subdivision de l’intervalle [a, b] par a = ao < a1 < a2 < ... < an = b telle que 
f soit continue chaque intervalle |a;, a;1[ et admette une limite à droite et à gauche en 
chaque a;. 


Exemple : une fonction continue ou une fonction en escalier est continue par morceaux. 
Une fonction continue par morceaux a l’allure suivante : 


Nous allons maintenant définir l’intégrale d’une fonction continue par morceaux, c’est- 
à-dire l’aire qu’elle délimite (en comptant positivement l’aire située au dessus de l’axe des 
x et négativement celle qui est située au dessous). 


Soit donc f une fonction continue par morceaux sur {a, b|. 


Comme nous allons considérer des subdivisions “de plus en plus fines” de l’intervalle 
[a, b], il faut introduire une notion pour mesurer cela : 


Définition: Soit a = &äp < &jy < A2 < ... < an — b une subdivision de l'intervalle 
[a, b], le pas de la subdivision est la quantité max(a;+1 — a;). On notera 5% l’ensemble des 
subdivisions de pas inférieur à 0. 


Soit o une subdivision a = ao < &1 < @2 < ... < an = b de l'intervalle [a, b], on notera 
I(f,o) la somme (souvent appelée somme de Riemann) : 


n—1 


T(f,0) := SN f(ai)(asr1 — &) 


i=0 


Il est clair intuitivement que cette somme approche la valeur de l’aire délimité par le 
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graphe de la fonction f et qu’elle l’approche d’autant mieux que le pas de la subdivision 
est petit. 
Il est donc raisonnable de définir : 


Définition: Une fonction f : [a,b] — R est intégrable si la limite de Z(f,o) quand le 
pas de la subdivision © tend vers 0 existe ; la valeur de cette limite s’appelle l’intégrale de 
f entre a et b et se note Fi f(t)dt. 


Une justification de cette notation (due à Leibniz) est qu’elle s’avère commode pour 
effectuer de façon mécanique des calculs (intégration par parties, changement de variables, 
etc, voir chapitre 17) ; une justification plus heuristique est que dt réprésente un accroisse- 


ment infinitésimal de la variable et que f f(t)dt est la limite de 37%, f(a+1(b—a))(1/n). 


THÉORÈME: (i) Une fonction continue par morceaux est intégrable. 
(ii) Si f est une fonction en escalier et f(la;,a;41[) = c; alors 


b n—1 
f(b)dt = SN cfaiy1 — ai) 
a i=0 
Démonstration: Il n’y a pas de difficulté à prouver la seconde partie (sauf peut- 


être la difficulté des notations ...). Nous ne donnerons hélas pas la preuve complète de 
l’intégrabilité d’une fonction continue par morceaux. Indiquons néanmoins quelques unes 
des étapes de la démonstration. Le point clef est de montrer que si f est continue par 
morceaux sur [a,b], alors on peut l’encadrer par deux suites monotones de fonctions en 
escalier l’approchant de mieux en mieux. Plus précisément on peut montrer : 


LEMME: Soit f une fonction continue par morceaux sur [a,b]. Alors il existe deux 
suites de fonctions en escalier g, et h, telles que sur [a, b] telles que, pour tout n > 1 et 
t € [a, b] on ait 

(i) gn(t) < ÿnH1(t) < FE) <'hnH1(t) <hn() 

(1) 0 < hat) — gn(t) < 1/n. 


Démonstration: (en partie admis) En découpant [a, b] en un nombre fini d’intervalles 
et en prolongeant par continuité f sur chaque intervalle ouvert où elle est continue on se 
ramène au cas où f est continue sur [a,b]. On utilise alors le fait (admis ici) qu’elle est 
uniformément continue, c’est à dire qu’il existe Ô — Ôô(n) tel que |x — x/| < Ô entraîne 
[f(x) — f(x')| < 1/2n. On choisit une subdivision de pas < ô(n) et on définit h, comme 
le maximum (resp. g, comme le minimum) de f sur chaque intervalle de la subdivision. 
Les suites aisni construites ont toutes les propriétés voulues sauf peut-être la monotonie. 
Il suffit alors de remplacer het 9 par = mimisue, het 9, —= maxi, 9m 0 


Si l’on choisit g, et h, comme dans le lemme, alors les suites v, — in ha(t)dt et 
= F 9n(t) sont adjacentes et leur limite définit P f(tjdt. D 
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Observons aussi qu’il découle de ces constructions que si par exemple f est continue 
par morceaux alors 


= i (b — a) É 
li —(b — — 
im 2_ ' C + = (0 o) = J f(t)dt 
Par exemple si f(t) = t? et [a,b] — [0,1] on en tire que 
1 HN dl nin+1l(@n+1) 1 
[ tdt = lim > (:) — = lim = 
0 mo ANT M 6n° 3 


Ce que l’on vérifiera par la suite bien sûr par une autre méthode. 


15.2 PROPRIÉTÉS DE L'INTÉGRALE 


Rassemblons en un théorème les principales propriétés de l’intégrale : 


THÉORÈME: Soient f,g des fonctions continues par morceaux, l'intégrale vérifie les 
propriétés suivantes : 
i) (Linéarité) 
b b b 
JL OrE + noter = à | roat+u | atoar, 
ii) (Positivité) 


b b 
F2 | rot | so 


de plus si les fonctions sont continues et on a f(to) > g(to) en un point to appartenant à 
l’intevalle [a, b|, alors OT > [° g(t)dt, 


ji) 
[ro 


iv) (“formule de ‘Chasles”) Si a < c < b alors 


[ro [ro [ro 


Démonstration: Le principe est d'établir ces formules pour les fonctions en escalier 
et d’en déduire la formule dans le cas général par passage à la limite. (i) La linéarité de 


b 
< [ir 


l'intégrale a f(t)dt = n Ci(@&i+1 — &) est claire pour les fonctions en escaliers. En effet 
la somme ne dépend pas de la subdivision choisie (c’est clair sur le dessin, pouvez-vous en 
écrire la preuve formelle?) et en choisissant une subdivision adaptée aux deux fonctions 
en escalier f et g la linéarité provient de la distributivité de la multiplication par rapport 


à l’addition. Soit donc f, et g, des fonctions en escalier telles que |f, — f| < 1/n et 
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[In — gl < 1/n, alors [(Afn — ugn) — (Af + ug)| < (|AÏ + [ul)/n et donc, en passant à la 
limite 


b b 
. (AS + ug)(#)dt =lim | (fa + lion )(6)dt 


— lim £ 4 n fl tt) 
b b 
= | fbdt+ n | g(t)dt 


(ii) Vu la linéarité, il suffit de vérifier que si f est positive alors e | a t)dt > 0. Mais 
il existe une suite de fonction en escalier f, > f telle que lim [° FE) = f° f(t) 


bien sûr 7 fn(t)dt est somme de termes positifs donc est positif. La deuxième M cnatos 
provient de ce que, si f est continue et, disons, f(c) Æ 0 avec c € [a,b] alors il existe 
un intervalle [d,e] € [a,b] (avec d < e) sur lequel f(x) > f(c)/2 et donc [2 fat > 
(e — d)c/2 > 0. 

(iii) Si f est une fonction en escalier égale à c; sur Ja;,a;41[ alors 


[real 


L’inégalité pour une fonction intégrable s’en déduit par passage à la limite. 
(iv) De nouveau il suffit de démontrer la formule pour une fonction en escalier, ce qui 
est immédiat. [ 


n—1 


b 
NES lo) a)= | LP ()ldt 


i=0 


(a+ mi @i) 


. : 1) à condition de définir, lorsque b < a, l'intégrale par rs F(bidte—= 
— f}" f(t)dt la formule (iv) est valable quelque soit a, b, c. 
. à m < f(t) < M sur l'intervalle [ab], on déduit aisément de (ii) et du calcul 
[° dt = (b— a) l'inégalité 


m(b — a) < [ro < ue 0 


15.3 THÉORÈME FONDAMENTAL DE L’'INTÉGRATION 


Définition: Une primitive d’une fonction f est une fonction F dérivable telle que EF" = f 


Remarque : Sur un intervalle 7 une primitive (si elle existe) est unique à une constante 
près. En effet si F; et F2 sont deux primitives, on voit que F1 — F2 à une dérivée nulle 
donc est constante. 


Il est difficile de surestimer l’importance du théorème suivant : 
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THÉORÈME: (théorème fondamental de l’intégration) Soit f une fonction continue 
sur l'intervalle [a, b] alors une primitive F est donnée par la fonction x + de f(t)dt et si 
F est une primitive de f on a la formule : 


b 
Î ro =F@ - Fa. 


Démonstration: Il suffit de vérifier que la fonction G{(x) := f” f(t)dt est dérivable et 
vérifie G’(x) = f(x) car alors on aura bien prouvé l’existence d’une primitive et comme 
G(a) = 0 on a bien fe f(t)dt = G(b) — G(a) et si F est une autre primitive de f on a 
F(x) = G(x) +C donc F(b) — F(a) = G(b) — G(a). Soit € > 0 et soit a <r <r+h<b, 
les propriétés de l’intégrale permettent d'écrire : 


7 : ; +, x x+h 
Ge += & Le if [ra | CEE [Gore 


mais f est continue en x donc il existe Ô tel que si x <t < x+h < x+0 alors |f(x)—f(t)| <e 


donc on obtient (si [h| < Ô) : 
se if a) = € 


Ce qui exprime bien que G est dérivable et que G’(x) = f(x) D 


ÉRUECS 


TT — f(x) 


L'importance de ce théorème vient du fait qu’il permet de calculer la plupart des aires 
(ou intégrales) de manière assez simple. Nous étudierons plus systématiquement le calcul 
des primitives au chapitre 17 et donnons l’exemple très simple suivant : 


b pr+i anti 
| ob = 
: m+l m+l 


En particulier Fa t?dt = 1/3 comme nous l’avons déjà vérifié. 
15.4 CALCULS APPROCHÉS D’INTÉGRALES 


Nous développerons au chapitre 17 des techniques de calcul de primitives et donc 
d’intégrales mais ces techniques ne s'appliquent pas à toutes les fonctions et il est souhaita- 
ble de pouvoir évaluer ces intégrales. Par exemple la fonction logarithme est définie comme 
log(x) :— dt/t donc si l’on veut établir une table de logarithmes, il faut savoir calculer 
de manière approchée une intégrale. De nos jours, bien sür, ces calculs sont programmés 
sur ordinateurs mais, demandez à vos parents (ou grands-parents) de vous montrer une 
vieille table de logarithmes Bouvard et Ratinet (dont le nom semble avoir inspiré Flaubert 
pour son oeuvre inachevée “Bouvard et Pécuchet”). 
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Commençons par le cas légèrement plus facile des fonctions monotones. Si f(x) est 


croissante et a < b on observe que f(a)(b — a) < OT < f(b)(b — a) donc plus 
généralement si a = ao < ... < an = b est une subdivision de l'intervalle [a, b] on obtient : 


n—1 n—1 aiÿ+1 b n—1 
D flan a) < 5 [rod f rot < Y Hai)(ai — a 
i=0 i=0 * di ge i=0 


En particulier si l’on choisit a; := a+(i/n)(b—a) et si l’on pose $,(f) := (22) . f(ai) 


on en tire Sy(f) < OL < Sa(f) + @=9) (f(b) — f(a)) d’où un calcul approché de 
l'intégrale. Ce type de calcul est illustré par la figure suivante : 


On peut aussi utiliser le même calcul pour estimer des sommes. Par exemple en 
prenant la fonction décroissante f(x) = 1/x° (avec a > 0) on obtient 


N N N—1 
Sun =) dtft® < S1/n° 
=? 1 nl 


En utilisant le théorème fondamental de l'intégration et, pour a = 1, la définition du 
logarithme, on sait que fe Di = (=) (= -1)siaZ£let dt/t® = log N si 
a = 1. Ainsi, si a £ 1 on a : 


O t I l li — = : 
n peut conclure par exemple que lim > +00 


Remarque : il n’est peut-être pas inutile de remarquer, pour ceux qui aiment expé- 

: 2 + 1 . … N 1 : 

rimenter sur machine, que, si l’on programme le calcul de la suite un = ÿ,,_, +, celle-ci 
semble converger! 
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Donnons maintenant une manière un peu plus générale et plus fine d’approcher la 
valeur d’une intégrale. L'idée est d'approcher la fonction par une fonction linéaire par 
morceau comme dans la figure ci-dessous : 


THÉORÈME: (méthode des trapèzes) Soit f : [a,b] — R une fonction deux fois 


continûment dérivable et soit M un majorant de f” sur l'intervalle et a; := a+ i@a) alors 


b 
[ra 2 Cor + 3H + Fa) ++ ju) < 


n 


Démonstration: On procède en intégrant par parties puis en choisissant judicieusement 
les constantes d'intégration. 


f'roa-te-arons - [7 e-xroa 
ao [5 -ae) rl L + [5 -x-u) ro 


Pour éviter d’avoir à calculer les dérivées f’(a;), on s’arrange pour que le deuxième 
crochet s’annule, c’est-à-dire que l’on choisit #2? — 2At — 2u — (t — a;)(t — a;:1) donc 
À = (a; + a;11)/2 et on obtient : 


[so - ent LE Pau ax)" 


2n 2 


M(b—a)° 
12n$ 


or cette dernière intégrale est bornée en module par À LC a)(ai1 —t)dt = 
En sommant les inégalités on obtient l'énoncé. DO 


Commentaires : la majoration énoncé est intéressante dès les premiers pas ; elle s’écrit 
pour n=l: 


id fat — to (Fa) + ru) <Tb-a) 


Pour n = 2 on obtient : 


f(t)dt — Ce Gro+zo+r (+) M 


La majoration est meilleure si M est petit (c’est-à-dire si la fonction n’oscille pas trop) et 
si n est grand (c’est-à-dire si la subdivision est fine) et moins bonne si (b — a) est grand 
(c’est-à-dire si l'intervalle d'intégration est grand). 

Exemple : (calcul approché de log2) Prenons a = 1, b = 2, n = 4 et f(t) = 1/t. 
On à maxsen.a |f"(t)| = 2 et 54 = FL (5+1+5+2+42) = 0,69702... et donc la valeur 
approchée : |log2 — 5,4] < 0,010166... 


Sir ISAAC NEWTON (1641-1717) 
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Newton Isaac (1642-1727) 
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CHAPITRE 16 QUELQUES FONCTIONS USUELLES 


Ce chapitre est destiné à fournir une bibliothèque de fonctions utiles : les fonctions 
polynômes (déjà étudiées au chapitre 6), la fonction logarithme, l’exponentielle (et plus 
généralement les fonctions a° ou x“), les fonctions circulaires sin(x), cos(x) et tg(x) ainsi 
que leurs “réciproques” Arcsin(x), Arcos(x) et Arctg(x). Les fonctions hyperboliques sh(x), 
ch(x) et th(x) et leurs “réciproques” Argsh(x), Argch(x) et Argth(x) — ces dernières 
étant moins indispensables puisque l’on peut les exprimer à partir du logarithme et de 
l’exponentielle. 


16.1 FONCTIONS LOGARITHME ET EXPONENTIELLE 


Définition: On appelle logarithme la fonction définie sur R* à valeurs réelles : 


log(x) := ' e 


t 
On voit immédiatement que log(1) — 0 et que log(x) > 0 pour x > 1 (resp. log(x) < 0 
pour x €]0,1|). 


THÉORÈME: La fonction log : R* — R est croissante, continue, indéfiniment 
dérivable ; en fait 


1 
log’(x) — " us logz ——-o et ALU log x = +00 
Z — 
T0 


De plus la fonction log est une bijection et un homomorphisme de groupe (elle transforme 
multiplication en addition) 


log(xy) = log(x) + log(y) 


Démonstration: D’après le théorème fondamental de l’intégration, la fonction log a 
pour dérivée 1/x et est donc croissante. Ensuite _ log(xy) = = 1 donc log(xy) — log x 


est une fonction constante en x. En prenant x = 1, on voit que cette constante vaut log y, 
d’où la formule log(xy) = log(x) + log(y). On en déduit que log(2”) — nlog(2) tend vers 
l'infini quand n tend vers l'infini et comme log est croissante cela entraîne que log(x) tend 
vers l'infini quand x tend vers l'infini. Enfin comme log(x) — —log(1/x) on en tire que 
lorsque x tend vers zéro (par valeurs positives) log(x) tend vers —-co. 0 


Remarque : Nous ne considérerons que cette fonction logarithme appelée parfois lo- 
garithme néperien. Historiquement, on utilisait pour les calculs “à la main” le logarithme 
décimal c’est-à-dire log;,9x = logæx/log10. La généralisation des calculatrices et ordi- 
nateurs à rendu désuètes les tables de logarithmes et enlevé son intérêt au logarithme 
décimal. 


Définition: La bijection réciproque de la fonction logarithme s’appelle la fonction 
exponentielle et se note exp : R — R*. 
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THÉORÈME: La fonction exponentielle est indéfiniment dérivable et croissante ; en 


fait L'exp(x) = exp(x). De plus 


lim exp(x)=0 et lim exp(x) = + 


T——00 T— +00 


et on à 


exp(x + y) = exp(x) exp(y) 


Démonstration: On a déjà vu que exp(x) est égale à sa dérivée ; ensuite les lim- 
ites découlent de celles calculées pour les logarithmes au théorème précédent ainsi que la 
dernière formule. O 


Il est indispensable de mémoriser l’allure des graphes des fonctions usuelles 


Remarque : Soit n € N (ou même n € Z) alors x” = exp(nlog(x)) ; en effet d’après 
le théorème précédent on a exp(log(x) +...+log(x)) = (exp(log(x)))" = x”. Ceci suggère 
la possibilité de définir a° ainsi : 


Définition:  (Puissances généralisées) Soit a € R* et bE R on pose 


a? := exp(blog a) 


En particulier, on retrouve pour n € N* les fonctions “racine n-ième” : a!/" = exp(+ log a). 


THÉORÈME: On a les formules suivantes, pour a, a >0etb,ceR : 


av+b = at a? 
(aa!)° me æa/ 
(a) _ ac 
EE 


De plus € (x?) = bb let L (a) = log(a)a®. 


Démonstration: Ces formules découlent immédiatement de la définition et des pro- 
priétés de l’exponentielle et du logarithme : par exemple a+? — exp((b + b')loga) — 
exp(b log a)exp(b' log a) et E (x?) = L (exp(blogx)) = bL(logzx)exp(blogx) = br?” 1. 
( 
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L’allure des graphes des fonctions f(x) = x“ est la suivante : 


Définition: On appelle base du logarithme le nombre e tel que log(e) = 1 ou 1 = | EL 


ou encore € = exp(1). 
I 1 DL 
Remarque : on a vu quee= lim [1+—+...+—)]— lim [1+—). 
n—0o 1! n! n— 00 n 
Notation : On a donc exp(x) = e” et on utilisera désormais cette notation. 


THÉORÈME: 
i) lim z“(logzx)" =0sia>0etnezZ 


x — 0 
x >0 
lim x“(logx)" = 0 si a < 0 

Æ—+o0 
C'est-à-dire “les puissances l’emportent sur le logarithme” 
ü) lim fe = + et 

æ— +00 
C'est-à-dire “l’exponentielle l’emporte sur les puissances” 


Démonstration:  i) Remarquons que pour x supérieur à un on a : 


logtr)= | "aft< | "Nr es) 


ainsi donc log(x)/x tend vers zéro quand x tend vers l'infini. De façon plus générale 
(log x)" /x° = ((n/a)" (log CSA TES tend donc aussi vers zéro quand x tend vers l'infini. 
Les autres limites s’obtiennent par des calculs similaires. OT 


16.2 FONCTIONS CIRCULAIRES ET RÉCIPROQUES 


Commençons par quelques rappels sur les fonctions cos(x) et sin(x). Tout d’abord 
prouvons l’énoncé admis aux chapitres précédents. 


PROPOSITION: 


ee es 
xz—0 % 
Le 
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Démonstration: Considérons un cercle de rayon r (avec des angles mesurés en radian) : 


Nous allons utiliser deux faits géométriques assez simples : l’aire d’un secteur angulaire 
(d'angle x) est donné par xr°/2 et la longueur de l’arc de cercle est donnée par xr (en 
particulier la surface du cercle est mr? et sa circonférence 27r), pour démontrer l'inégalité 
suivante : 


LEMME: Soit 0 < x < 7/2 alors sin(x) < x < tg(x). 


Démonstration: Appelons x l’angle sur la figure ci-dessus en prenant r = 1 ; alors 
sin(x) = OA = CB < CD < arc(CD) = x. Par ailleurs l’aire du secteur d'angle x est 
égale à x/2 et est majorée par l’aire du triangle OED qui vaut ED/2 = tg(x)/2 d’où le 
lemme. 


COROLLAIRE: Pour 0 < |x] < x/2 on a cos(x) < sin(e) < 1 ; en particulier 
. _sin(x) 

lim ——— 

z—0 PA 


—; 1; 
Démonstration: En effet on obtient pour 0 < x < T/2 l'inégalité cos(x) < sin(x)/x < 1 


qui est donc valable pour 0 < |x| < x/2 puisque cos(x) et sin(x)/x sont paires ; enfin comme 
cos(x) est continue on a limz_,0 cos(x) = cos(0) = 1.0 


Traçons le graphe de la fonction sinus, celui de cosinus s’en déduit par translation 
puisque cos(t) = sin(5 + t) : 
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FORMULAIRE : 

sin(—t) = —sin(t), cos(—t) = cost) et tg(—t) = — tg(t) 

sin(t +7) = —sin(t), cos(t + mr) = — cos(t) et tg(t + x) = tg(t) 

cos?(+) + sin°(t) = 1 

sin(x +t) = cos(t)sin(x) + cos(x) sin(t) et cos(x + t) = cos(x) cos(t) — sin(x) sin(t) 

te(x +4) = (te(t) +te(x))/(1 — te(x) te(t)) 

sin(t) = 2tg(t/2)/(1 + tg°(t/2)) et cos(t) = (1 — tg?(4/2))/(1 + tg°*(4/2)) 

On peut aussi signaler que cos(t) = cos(x) équivaut à { = +x+2kr (avec k € Z) alors 
que sin(t) = sin(x) équivaut à { = x +2kr out = r —-x+2kr (avec k € Z). On peut aussi 
observer que a cos(x) +bsin(x) = Va? + b? sin(x +6) où © est tel que sin(®) = a/Va? + b? 
et cos(p) = b/V a? + b2. 

La fonction sin : [-5,+%] — [-1,1] est une bijection (strictement) croissante ; en 
effet il suffit d'utiliser le théorème du chapitre 13. 


Définition: (“Arc sinus”) La bijection réciproque de la fonction sin : [-7F,+ 
[—-1,+1] se note Arcsin : [—1,+1] — [-5,+5]. 
On peut en tracer le graphe par symétrie à partir de celui de sin(x) : 


THÉORÈME: La fonction Arcsin : [—-1,+1] — [-5,+%5] est continue, croissante, 
impaire et vérifie : 

i) y = Arcsin(x) & {x = sin(y) et yE[-T,+7]} 

ii) Arcsin(x) est indéfiniment dérivable sur | — 1,+1[ et 

L 
VI? 


Arcsin’(x) — 


Démonstration:  i) Découle de la définition de Arcsin comme bijection réciproque. 
ii) Provient du théorème donnant la dérivée d’une fonction réciproque : si x = sin(y) 


et y €] — 5,+21[ alors dx/dy = cos(y) > 0 et donc vaut 4/1— sin?(y) = V1 — x? d'où 
dy/dx =1/V1-2%2.0 


On peut faire une construction analogue en observant que cos : [0,7] — [—1,+1] est 
une bijection décroissante. 
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Définition: (“Arc cosinus”) La bijection réciproque de la fonction cos : [0,7] — [-1,+1] 
se note Arcos : [—-1,+1] — [0,7]. 
On peut en tracer le graphe par symétrie à partir de celui de cos(x) : 


Toutes les propriétés de la fonction Arcos(x) se déduisent de celle de Arcsin(x) et de 
la formule suivante (visible sur le graphe) : 


PROPOSITION: Sixe|-1,+1] on a Arcsin(x) + Arcos(x) = T/2 


Démonstration: On calcule (comme pour Arcsinus) que Arcos’(x) = —1/1 — x? donc 
la dérivée de la fonction Arcsin(x) + Arcos(x) est nulle, donc la fonction est constante et 
en calculant la valeur en x = 0 on conclut. 0 


La fonction tg :] —- 5,+5[-— R est une bijection (strictement) croissante ; en effet il 
suffit d'utiliser le théorème du chapitre 13. 


Définition: (“Arc tangente”) La bijection réciproque de la fonction tg :] —-5,+5[—-R 


2 
se note Arctg : R —] -7,+7|. 
On peut en tracer le graphe par symétrie à partir de celui de tg(x) : 


THÉORÈME: La fonction Arctg : R —]-— 7,+7] est continue, croissante, impaire et 
vérifie : 
i) y = Arcte(x) & x = tg(y) et ye]-F,+5 
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ii) Arctg(x) est indéfiniment dérivable sur R et 


Arctg'(x) = 

TE) x? +1 
… . T Le T 
iii) lim Arctg(x) = : et lim Arctg(x) — 79 


Démonstration: _i) et iïi) découlent de la défintion de Arctg comme bijection réciproque. 
ii) Le calcul est similaire à ceux déjà effectués : si x = tg(y) alors dx/dy = (1 + 
tg?(y)) = 1+x° donc dy/dx = 1/(1+%?). CO 
Remarque : La fonction Arctg vérifie une intéressante équation fonctionnelle : 


PROPOSITION: Soit x € R* alors Arctg(r) + Arctg(1/x) = sgn(x)5 (où le signe 
sgn(x) vaut +1 six > 0 et —-1 si x < 0). 


Démonstration: Le calcul de la dérivée du membre de gauche donne : (Arctg(x) + 
Arctg(1/x))" — as + = SFA) — 0 donc cette fonction est constante sur R* et R* 


(notez qu’elle n’est pas constante sur R* tout entier!). Par ailleurs Arctg(1) = x/4 et 
Arctg(—1) = —r/4 permettent de calculer ces constantes. 0 


16.3 FONCTIONS HYPERBOLIQUES ET RÉCIPROQUES 


On peut définir des fonctions sinus, cosinus et tangente hyperboliques et travailler 
avec elles de manière tout-à-fait analogue. Nous serons brefs car ces fonctions sont moins 
importantes que les “vraies” fonctions sinus, cosinus et tangente. 


Définition: La fonction sinus hyperbolique est définie par 


sh(x) ee —e? 
ch(x) et+e-x 


Le nom de ces fonctions vient du fait que t + (cos(t),sin(t)) paramétrise le cercle 
d’équation x?+y? = 1 alors que t + (ch(t),sh(t)) paramétrise (une branche de) l’hyperbole 
d'équation x? — y? — 1. 

Une autre explication (que nous ne formaliserons pas) aux noms et analogies entre 
fonctions circulaires et hyperboliques est la suivante : on se souvient que cos(x) = (e* + 
e7#*)/2 et sin(x) — (e* —e-*)/2 et on en tire (formellement) que ch(x) = cos(ix) et 
sh(x) — isin(ix) 
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Donnons les représentations graphiques des trois principales fonctions hyperboliques, 
les fonctions sh(x), ch(x) et th(x) : 


Passons à la construction des fonctions réciproques 
La fonction sh : R — R est une bijection croissante, donc : 


Définition: (Argument sinus hyperbolique) La bijection réciproque de la fonction 
sh: R — R se note Argsh : R — R. 


La fonction ch : R} — [1,+c) est une bijection croissante, donc : 


Définition: (Argument cosinus hyperbolique) La bijection réciproque de la fonction 
ch:R} — [1,+co) se note Argch : [1,+00) —R,. 


La fonction th : R —] — 1, +1] est une bijection croissante, donc : 


Définition: (Argument tangente hyperbolique) La bijection réciproque de la fonction 
th: R —]-—1,+1] se note Argth :| —-1,+1[— R. 


THÉORÈME: Les fonctions Argsh, Argch et Argth son continues sur leurs domaine 
de définition et dérivable à l’intérieur de celui-ci, de plus : 


i) Argsh’(t) — + et Argsh(t) = log(t + Vt? +1) 


= et Argch(t) = log(t + V#t? — 1) 


ii) Argch’(t) = 
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1 1 1+4 
iii) Argth'(t) — 1=Z et Argth(t) = . log (=) 


Démonstration: Les trois énoncés se démontrent de manière similaire ; prouvons le 


premier : si æ = sh(y), alors dx/dy = ch(y) = 1/1+sh°(y) = V1 +22. Un calcul direct 


montre que la dérivée de log(x + V2 +1) vaut : on en tire donc Argsh(x) — 


J 
VT+x 
log(x + Vx? +1) +C'et l'évaluation des deux fontion en x = 0 donne C’=0. D 


FORMULAIRE : 

sh(—t) = —sh(t), ch(—t) = ch(t) 
ch?(t) — sh°(#) = 

sh(x +t) = sh(x) ch(t) + ch(x) sh(t) 
ch(x +t) = ch(x) ch(t) + sh(t)sh(x) 

the +0) = FRE et 

h(t) = LRGP) et ch(t) = ED) 

sh(æ) +sh(t) = 2sh(##) ch(Æt) et ch(x) + ch(t) = 2ch(#) ch(St). 


tn 
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CHAPITRE 17 CALCUL DE PRIMITIVES 


Nous avons vu au chapitre 15 que le calcul d’une intégrale peut se ramener au calcul 
d’une primitive de la fonction à intégrer. Nous avons constitué au chapitre 16 une biblio- 
thèque de fonctions usuelles. Un espoir un peu naïf consisterait à penser que les primitives 
de ces fonctions usuelles s'exprime de nouveau à partir de ces fonctions usuelles. Mais 


des fonctions comme exp(—t?) ou TS détruisent cet espoir : les fonctions N(x) := 


dl. exp(—t?)dt et M(x) :— 1 eu ne peuvent pas s'exprimer à partir des fonctions 
usuelles ; on peut néanmoins étudier et utiliser ces fonctions (la fonction normale N est 
utilisée en statistiques et probabilités et la fonction M -— liée aux fonctions elliptiques — est 
utilisée en physique et dans diverses branches des mathématiques). Après tout la fonction 
logarithme a été introduite pour donner une primitive à la fonction 1. Il existe ainsi une 
théorie du calcul formel de primitives qui est assez complexe ; nous nous contenterons donc 
d'étudier un certain nombre de techniques ou “recettes” permettant de calculer (d'exprimer 


en termes de fonctions usuelles) quelques primitives. 
17.1 QUELQUES PRIMITIVES CLASSIQUES 


Rappelons que sur un intervalle, une primitive d’une fonction continue existe et est 
unique à une constante près. Introduisons la notation fort commode suivante 


Notation L'écriture { f(t)dt désignera une primitive de la fonction f. 


Il ne faut pas confondre F f(t)dt, qui est un nombre et f f(t)dt qui désigne une 
fonction ; par exemple on écrira f est — Arctg(t) +C. 


Il faut faire la remarque qu’il y a parfois une façon assez “bête” de calculer des 
primitives : si on trouve (par quelque procédé que ce soit) une fonction F(t) dont on sait 
calculer la dérivée et qui vérifie F”(t) = f(t), alors on a bien sûr trouvé une primitive de 
f. Commençons ici par une liste de primitives assez faciles à établir : 


fonction primitive 
tari 
t° ot +C si a Z —1 
‘2e log [t| + C 
at 
et S. +C 
a 
a 
a! +C si a > 0 
log(a) 
cos(t) sin(t) +C 
sin(t) — cos(t) + C 


primitive 


fonction 
1 Peso T 
l = + — i —_ Z 
nes ke (5+7)|+c sités+T 
: log |t - +C ité TZ 
sin(#) AD ns du, 
tg(t) — log | cos(t)| + C sit € 5 + TZ 
cotg(t) log |sin(t)| + C sit rZ 
ch(t) sh(t) +C 
sh(t) ch(t) +C 
1 
ch(t) +C 2 Arctg(e!) +C 
10 pile PE 
RUE og ; si 
th(t) log ch(t) + C 
coth(t) log |sh(t)| + C sit £0 
1 1 t 
F2 > 2 5 Arctg (:) + C 
1 1 t—a 
_] l + 
2 —a 2a of Le. HE 
1 TRE 
Rp log |t + 2 +a|+C 
V a 
1 
De log [t + VE —-a|+0C si [é| > |al 
— à 
L Au l c : 
= rcsin | = + si [é| < |a| 


Remarque : 


t 


on peut souvent donner plusieurs expressions d’une primitive et, dans 


ce cas, ces expressions sont égales à une constante près. Par exemple une primitive de 


ES: LES j 
TEA est aussi Argsh 


t 


lal 
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: . je 1 . 
;: une primitive de 7e ‘st aussi Argch 


lal 


(si t > 0) ou 


Argch (4) (si t < 0). 


lal 


Démonstration: La plupart de ces formules ont déjà été établies et de toutes façons 
peuvent se vérifier directement en dérivant ; dans la partie suivante on donne des techniques 
générales permettant d’ailleurs de les retrouver. Par exemple calculons la dérivée de la 
fonction f(t) := log |tg(5 + ?)| : 


Ci tg'(à + 
2 te(5 + 


) 1 


T 
47 = 
LL 
4 


FE) 


17.2 TECHNIQUES GÉNÉRALES 


On considère dans ce paragraphe uniquement des fonctions f, g, etc continues réelles. 
Linéarité : soient À, ER et f,g continues : 


b b b 
| (SE + ug(t))dt = À [. ft + u | fat 


Exemple : nous savons (voir les formules étudiées au chapitre 4 donnant cos(nt) comme 
polynôme en cos(t)) que : 


cos{(t) — € (cos(4e) + 4cos(2t) + 3) 
donc on en déduit : 
L cos*(t)dt — = (Ein(4e) + 8sin(2t) + 12€) +C 


Ainsi, par exemple, fe ? cos“ t)dt — 37/16. Le même style de calcul permet d’intégrer 


sans difficultés cos”’(t) ou sin”"(t) (au moins si m n’est pas trop grand). 
Intégration par parties : 


THÉORÈME: Soient f,g deux fonctions continûment dérivables, alors : 


b b 
k F()g'(t)dt = F(b)g(b) = (oa(o)- | f'(t)g(t)dt 


Démonstration: Il suffit d’intégrer la relation entre dérivées fg' = (fg) — f'g. D 


Sous forme mnémotechnique on retiendra : f udu = uv — f vdu. 
Exemples : 
1) en prenant u := log(t), v := t on obtient : 


Jos = tlog(t) - Ja = tlog(t) —t+C 
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Plus généralement si a € R\{—1} et m € N, posons u = log””(t) et vu — ee : on obtient 
alors : 
ie log” (t)dt — pe er nl log" (t)dt — T J* log" (t)dt 


Cette formule, appliquée m fois permet d’exprimer la primitive cherchée sous la forme 
t4T1P(log(t)) où P est un polynôme de degré m. 
2) en prenant u := t"* et v :— ef on obtient : 


1 
feed = met LT feet 
(02 (02 


d’où l’on tire, en itérant m fois, une expression d’une primitive de la forme e“P(t) avec P 
polynôme de degré m. 
3) deux intégrations par parties permettent de calculer J := f sin(t)e‘dt : 


1 : at 1 at 1 : at 1 at 1 : at 
I = a sin(t)e® — L J este di : sin(t)e® — mo) cos(t)e® — m sin(t)e®"dt 
d’où 


= rat sin(t) — cos(t))e‘!. 


4) l'intégration par parties permet aussi de démontrer la formule de Taylor “avec reste 
intégral” : si f est une fonction n + 1 fois continument dérivable alors : 


n b Jin 
Pa ++ (a) + Î CERUE D fr (t)dt 


Démonstration: La preuve s'effectue par récurrence sur a RE DO ne 06 
formule équivaut au théorème fondamental de l’intégration f(b) a)+ Le f'(tjdt. Sil’on 
pose u := f(r#1)(4) et v := —(b — ET /(n + ue alors la formule par parties 
: b b—t)" (mn b—a a b pt tt en 7 
fournit : f, D f Mode TT AIO ER Eu ftr#2)(t)dt. Cette dernière 
égalité est exactement celle dont on a besoin pour la récurrence. [ 


Par exemple, pour la fonction e* entre 0 et 1 on trouve : 


1 1 ae, 


Changement de variables : 


THÉORÈME: (première forme) soit g continûment dérivable, f continue, alors : 
b , g(b) 
[ reset - [fau 
a g(a 
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Démonstration: Considérons les deux fonctions F1(x) := [} f og(t)g'(t}dt et Fi(x) := 


9(æ) f(u)du et soit F une primitive de f alors le théorème fondamental donne que FT(x) = 
g(a) 1 


fog(x)g'(x) et F(x) = Fog(x) —Feg(a) d'où F;(x) = F(g(x)g'(x) = fog(x)g'(x). On 
en tire que F1 — F2 est constante, mais Fi(a) = F2(a) = 0 donc F1 = F5. D 


En fait on emploie rarement le théorème de changement de variables sans que la 
fonction g ne détermine une bijection de [a, b] sur l'intervalle d’extrémités g(a), g(b). Dans 
ce cas la formule s'écrit (en notant h := g-!) sous sa “deuxième forme” : 


h(d) d 
| fo g(t)g (dt = | f(u)du 
h(c) c 


Après avoir vérifié que g détermine bien une bijection on peut présenter les calculs de la 
façon suivante : 

(1) On pose t = g(u) (& u = g-(#)). 

(2) On calcule dt — g'(u)du. 

(3) On obtient alors [ f(t)dt = [ f(g(u))g'(u)du. 


Il n’est pas du tout évident de trouver un “bon” changement de variables mais voici 
quelques exemples (on donne quelques applications supplémentaires dans le paragraphe 


suivant) : 
1) Dans le domaine ]0, a[ on cherche à intégrer la fonction f(t) := (ta? — #2). Pour 
cela on choisit le changement de variables u := a/t (ou encore t := a/u) qui détermine 


bien une bijection de tout intervalle [c, d] sur [a/d, a/c] (pourvu que 0 < c < d) on obtient 
alors : 


;L dt 4 : du 
tva? — 1? a J Vu? =1 
On choisit alors le changement de variables uw = ch(y) (possible car u > 1) en observant 


que Vu? — 1 — v/cn?(u) — 1 = V/sh?(9) — sh(y) donc 


1 = Je = 0 + © = Are) 


et enfin 7 : : 
a 
Jo ae” Argch(u) + C = se Argch (5) +C 
2) En introduisant le changement de variables u — —t on obtient : 


—@ 


b —b 
| sodt= [Hat = | ru 


— «a == 
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En particulier si f est paire on voit que Pot f(t)d = f°,f t)dt alors que si f est 


impaire É f(t)dt = — 1 f(t)dt; graphiquement on obtient : 


f paire f impaire 
… Le changement de variable u := t + c (où c est une constante donne la formule 
fe f(t) . 10 . (u — c)du donc par exemple si la fonction ; admet pour période T on 
obtient f(t)dt = on f(t)dt et ensuite [| FES Sp u)du. En effet 


f's08-- [roa [e ef va [ ro 


17.3 PRIMITIVES DE FRACTIONS RATIONNELLES 


La décomposition en éléments simples d’une fraction rationnelle (chapitre 6) permet 
de ramener le calcul des primitives de fractions rationelles au calcul d’une primitive de 
G Fur . de re. La première est très simple : on obtient log [t — al sin — 1 et 
des sinon ; la seconde se ramène au calcul d’une primitive de Ces 
peu plus complexe. 


De et est un 


FORMULE 1 : 
dt — +C sinZl 
sin 

ls = (n —1)(t- a+ 

(t— a) loglt—-a|+C seul 
Remarquons maintenant que 
ct + d . “e 2t+a +( — 1 
(2+at+b}t  2(12+at+b)" 2 / (2+at+b)" 


et donc on est ramené par linéarité à intégrer chacun des deux morceaux. 


FORMULE 2 : 


| 2+a re ere +C sin Z£l 
(t2 + at + b) logft?+at+bl+C sin=1 
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Pour traiter le deuxième membre rappelons que 4b — a? > 0 et notons ô := V4b — a? et 
utilisons la réduction standard d’un polynôme du second degré : 


2 
2 , a\2 67 6? 2t+a 
t +at+b=(t+2) Ar 0 5 +1 


Ceci suggère d’effectuer le changement de variables u := 2e : on obtient alors : 


er L ONE. 


On est donc bien ramené à calculer une primitive I, = f Dr Cela peut se faire ainsi : 


tr) ÿ : 1 2nu°? — As 2f + 2n 
(u2+1)9) (u2+1)% (u2+1)n41  (u2+1)9  (u2+1)r#1 
En intégrant on obtient la formule de récurrence : 
FORMULE 3 : (rappelons qu’on a posé 1, = f Grey) 


u 
nat On le. #0 
nlns1 = (2n ) Tuer 


En particulier 


= ; in = Arctg(u) +C 


u? +1) 
du 1 u 
Fe | Greco rs © 
du 3 au u 
Be = C 
| lan g ABUS En amet 


(Comme il se doit, la Formule 1 est la plus rapide) 


Exemples de calculs explicites : 
1) reprenons la fraction rationnelle du chapitre 6, i.e. f(t) := (410+#2+1)/(49 245 +4) 
dont la décomposition en éléments simples est 


OR si — 
Ut  16(+1)2 16(6—1)2 t2+1 A4(f2+1} 
et ainsi 
- 3 1 1 L 1 
t)dt = — + log|t _ 2 og 2 + 1| = +cC 
110 +hetl+ & ( =) RÉ Sen 
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2) soit n impair, on a calculé durant le chapitre 6 la décomposition suivante : 


= 2tcos(2rh/n) — 2 


1 1 
EN —I) = ++ = — 
/( ic n |t-1 ii 2 t2 — 2tcos(27h/n) +1 


Pour calculer une primitive de chacun des derniers éléments simples on observe que t? — 
2 cos(a) + 1 = (4 — cos(a))? + sin?(a) — [(£ — cos(a)/sin(a))? +1] sin?(a) donc si l’on pose 
u := (t — cos(a))/sin(a) on obtient 


J dt nl | du 
t2—2cos(a)t+1 sin(a) J u2+1 


et donc par linéarité on en tire 


n—1 


/ ee > {cos(2rh/n) log [# — 2cos(2rh/n)t + 1] 
( De 


tt —1) n+1 


t— cos(27h/n) 
sin(27h/n) ) PS 


— 2sin(2rh/n) Arctg ( 


Un grand nombre de calculs de primitives se ramène, grâce à un changement de va- 
riables adéquat, au calcul d’une primitive de fraction rationnelle. Nous citons ici quelques 
applications. 


i) Si f est une fraction rationnelle en posant le changement de variables u = e* on 


obtient la formule f f(e*)dx = f FCsdu et l’on sait donc calculer une primitive des fractions 
rationnelles en e*. 


ii) Soit f une fraction rationnelle en deux indéterminées et cherchons une primitive 
de f(cos(x),sin(x)) ; pour cela on effectue le changement de variables t := tg(x/2) ou 
encore x = 2 Arctg(t) et dx = 2dt/(1 ++?) en utilisant cos(x) — (1 — #?)/(1 ++?) et 
sin(x) = 2t/(1 +1?) on en déduit : 


ES d 
J fonte sintohar = [1 ) 2 


donc on saura calculer une primitive. 
Par exemple retrouvons par ce principe une primitive de 1/sin(x) et 1/cos(x). On 
peut écrire 


d dt 
| = À = loglt + C = log|te(x/2)| + C 
sin(x) t 
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et en faisant le changement x := 5 —u 


IE =-| + = — log |tg(u/2)| + C = — log|tg(r/4 — x/2)| + C 


cos(x) sin(u) 


ii) un autre exemple intéressant est celui des intégrales (dites abéliennes) suivantes : 
il s’agit des primitives de f(x, %/(ax +b)/(cx + d)) où f est de nouveau une fraction 
rationnelle en deux indéterminées. On supposera ad — bc 3 0 (sinon le calcul est déjà fait) 
et on posera 


re ae du” —b ru idu 
= UN — & x = ——— donc dr = (ad — bc) -—— 
A cx + d out a (—cu® + a)? 


d’où la formule de changement de variables : 


du —b ) mu ldu 
( 


ch m 2 
—cu® + à —cu® + a) 


IEC To + Der + Dar = ad ve) | 1 ( 


Prenons un exemple concret : le changement u := * 2 donne 


si de =6 | u°du 

æ+1 (u3 — 1)2 
(il resterait bien sûr à calculer une primitive de u*/(u°—1)? en la décomposant en éléments 
simples). 


iv) considérons les intégrales du type f f(x, Vax? + bx + c)dx. On factorise le poly- 
nôme du second degré en posant À = b? — 4ac = €? (où € = +1) et alors 


2 2 2 
ax? + bx + c = a ( m3) — E 


Aa? Ô Ô 


on effectue naturellement le changement de variable w := 2x — = 2 et, si n désigne le signe de 


a on obtient une intégrale du type f g(u, 4/mu? — n=)du où g une fraction rationnelle. 
On distingue alors les cas suivants : 

CAS 7 = Ee = 1: on pose u = ch(t) (avec disons { > 0) donc Vu? — 1 = sh(t) et 
f'g(u, Vu? — 1)du devient f g(ch(t),sh(#)) sh(t)dt que l’on sait intégrer. 

CAS n = 1e = —1 : on a. u = sh(t) et donc on a Vu? +1 = ch(t) et l'intégrale 
J g(u, Vu? + 1)du devient f g(sh(t),ch(#)) ch(t)dt que l’on sait intégrer. 

CAS nm = —1,€e = 1: on pose u := sin(t) (sur un intervalle convenable) donc V1 — u? — 
|cos(t)| et f g(u AS — u?)du devient f g(sin(t), | cos(t)}) cos(t)dt que l’on sait intégrer (le 
Cas 7 =E = —1 se bien sûr, exclus). 
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CHAPITRE 18 INTÉGRALES IMPROPRES 


Nous avons vu que l'intégrale d’une fonction continue par morceau sur un intervalle 
fermé [a,b] est toujours définie. Une intégrale “indéfinie” ou “posant problème” est une 
intégrale soit d’une fonction non continue sur un intervalle [a,b] (par exemple 1 dej) 
ou d’une fonction continue sur un intervalle non borné comme [a,+oo) (par exemple 

ia dx/x). Ces intégrales n'existent pas toujours et on étudie dans ce chapitre des condi- 
tions de convergence et même dans certains cas des méthodes de calcul. Il faut remarquer 
que de nombreuses intégrales de ce type surgissent naturellement dans les sciences : les 
calculs de potentiel créé par une masse conduisent à de tels intégrales ; on peut signaler 
une formule importante (entre autres) en probabilité et statistique : 


+00 > 
pe e * dx = V7 


— OO 


Rappelons que l’on ne peut pas exprimer par des fonctions élémentaires une primitive de 
: m2 
la fonction e* 


18.1 INTÉGRALES IMPROPRES 


Définition: Soit f une fonction continue {a,b[— R ; si lim f(t)dt existe, alors on 
appelle cette limite l’intégrale impropre de f entre a et b et on écrit : 


[ ftdt:= lim. | fa 


c— b a 


c<b 


Convention : on devrait normalement se garder d'écrire fe f(t)dt avant de savoir que cette 


limite existe ; il est néanmoins d’usage d'écrire “l’intégrale le f(t)dt est divergente” si cette 
limite n'existe pas. 

Donnons quelques exemples : 

1) Soit f(t) = log(t) alors [ log(t}dt = [t log(t) — t]l = x — x log(x) — 1 donc 


1 
j log(t)dt — lim (x — xlog(x) — 1) = -1 
0 un 


L’aire hachurée vaut 1 


2) Soit f(t) = t* alors f} t%dt = [#*t1/(a + 1)}£ = ctŸ1/(a + 1) — 1/a + 1 (resp. 
Hlog(t)]£ = log(c)) si a Æ —1 (resp. si a = —-1). La limite lorsque c tend vers +oo existe 
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seulement quand a < —1, la limite quand c tend vers zéro existe seulement quand a > —1 


et on obtient 
ee LL sia>l 
. ” | diverge si a <1 


1 _1 : 
dre 0e 
0 diverge si a>l 


Par exemple L dt/Vt=2et [°° défi? VE = 2/3. 

Remarque : Si une niérréle est impropre en plusieurs points, on dira qu’elle est 
convergente si elle convergente au voisinage de chaque point. Par exemple l’intégrale 
Es e-ltldt/,/1t] est définie comme : 


si d 1 x 
li tjdt+ li tjdt + Li tjdt+ I t)dt 
im] fOdt+ lim | Hat+ im [ FOat+ im, [10 
ou f(t) := e-l‘ldt/,/1tl. En termes concrets : pour étudier une intégrale impropre on 


“découpe les difficultés”. 

Pour démontrer le théorème on utilisera le critère assez intuitif suivant (dit critère de 
Cauchy) : soit F : [a,b[— R telle que F(c) — F(c!) tende vers zéro lorsque a < c < € <b 
et c tend vers b, alors F(x) tend vers une limite finie lorsque x tend vers b. 


THÉORÈME: Si l'intégrale D |f(t)Idt, impropre en b, est convergente alors l'intégrale 
s f(t)dt est également convergente et l’on a | f(t)dt| < |f(t)ldt. 


Démonstration: D’après le critère évoqué précédemment (appliqué à F(x A f(t) 
l'intégrale [° f(t)dt converge si et seulement si je f(t)dt tend vers 0 ru GÉcSee 
et c tend vers b. Le théorème découle alors de l'inégalité | [© f(t)dt| < [© [f@ldt. E 


— RAR 
La réciproque est fausse ; par exemple nous verrons que in . est convergente 


sin() 


alors que pe dx est divergente. 


THÉORÈME: Supposons que |f(t)| < g(t) alors la convergence de l'intégrale ii g(t)dt 


entraîne la convergence de Fa f(t)dt ; la divergence de L f(t)dt entraine la divergence 
b 
J, g(t)dt 


Démonstration: D’après le théorème précédent, il suffit de voir que Je ; [f(t)Idt est 


convergente. Or la fonction F(x) := [7 |f(t)|dt est croissante et bornée par “ g(t)dt donc 
converge vers une valeur finie lorsque x tend vers b. D 


THÉORÈME: Soient f(x), g(x) deux fonctions positives équivalentes aan x tend 


vers b alors l'intégrale Fe f(t)dt est convergente si et seulement si l'intégrale fe g(t)dt est 
convergente. 
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Démonstration: Comme les fonctions sont équivalentes, on a sur un voisinage de b des 
inégalités de la forme : C'f(x) < g(x) < C’f(x) ; en appliquant le théorème précédent on 
en déduit que la convergence d’une des deux intégrales entraîne la convergence de l’autre. O 


Exemples de calculs (les détails sont laissés en exercice) : 


dt 


PA ca D D [- 


18.2 CALCULS D’INTÉGRALES IMPROPRES 


Les techniques de calcul que nous abordons peuvent se résumer ainsi : on applique les 
techniques de calcul des intégrales finies (linéarité, intégration par parties, changement de 
variable) et on passe à la limite. Ce paragraphe est donc un paragraphe d'exercices et ex- 
emples, on détermine notamment quand JE (ait +...+a,t")e tdt/t est convergente. 


PROPOSITION: (Linéarité) Soient à,B € R et f,g : [a,b[— R deux fonctions 
continues dont les intégrales sur [a, b] convergent, alors l'intégrale de a f + Gg converge et : 


b b b 
je (af(t) + Bg(t))dt = à | fat + 6 1 g(#)dt. 


Démonstration: On utilise la linéarité de l’intégrale usuelle et on passe à la limite. D 


Exemple : Posons ls) := "g ettSdt/t, les critères du paragraphe précédent per- 
mettent d'établir que l’intégrale converge si et seulement si s > 0. Si donc 51,...,5, > 0 
alors 


+00 
L (ait +... +at)e tdt/t = al (s1)+...+a.T(s,). 
0 


PROPOSITION: (Intégration par parties) Soient f, g : [a,b[— R continûment dériva- 
bles alors : 


b b 
Î Od/ bat = im og - fog(o) - [ Oxo 


où la convergence de deux termes entraîne la convergence du troisième. 


Démonstration: On utilise l'intégration par parties de l’intégrale usuelle et on passe à 
la limite. D 


Exemple : 


+00 jé _ nn 
/ 1 IR 1 
F(s) — L e tt ldt= lim ne — lime ‘ Es se “| é 4 = (s SE ) 
ù 8 Jo s 


C— +00 S c'—0 S 
En calculant l(1) = 1, on en tire F(m) = (m — 1)! pour m € N*. 


165 


PROPOSITION: (Changement de variable) Soit f : [c,d[— R continue dont l'intégrale 
sur [c, d] converge, soit g : [a,b[— Îc, d[ une bijection continûment dérivable alors : 


j | fo g(og (D = ji | ftu)du 


Démonstration: On utilise le changement de variable de l’intégrale usuelle et on passe 
à la limite. O 


Exemple : 1) Soit Z(b) :—= due e-(#-a)/b4t. Faisons le changement de variable 
Vbu := x — a, on obtient J(b) = VbI(1). Si l’on sait que (1) = /7 on obtient la formule : 


+00 - 
. e 0) y = V7b 


OO 


2) On peut aussi en déduire la valeur de l(1/2) (et donc de l'(n+1/2) ) ; on effectue cette 
fois le changement de variable u = 4 : 


T'(1/2) [7 D ee 4 he du = Vr 

= e = e = e u = VT 
0 VE 0 

Terminons ce chapitre par l’étude d’une intégrale “semi-convergente” : 


+00 
L'intégrale 1 
0 


valeur est en fait 7/2 mais nous ne prouverons pas cela). 


: +oo .: 

sin(x sin(x 

se) dx est divergente mais 1 EE est convergente (sa 
0 


pa 


Démonstration: Lorsque x tend vers 0 alors sin(x)/x tend vers 1 donc l'intégrale n’est 
qu’apparemment impropre en 0. Utilisons les inégalités suivantes : 


FDF | én(x) PAT lie )] 1 L 2 
x > dx = sin(x)|dx = -—— 
a D ee (N +1)r (N + . JE) (N +1)r 
donc fera sin() dx >  … -n or cette dernière somme tend vers l'infini donc 
+0 | sin(x) 


l'intégrale J, dx est divergente. 


LA 


Pour prouver la convergence de RE SM) gr, on peut utiliser une intégration par 
parties : 


LL “0e 0 jh 07 


x X x? 


+ s + . . 
Œ SE) dr est convergente car EI < Het [7 dx = 1 est convergente. Ainsi 


J. SC) go est convergente. Cl 
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Remarque : Pour calculer une valeur approchée d’une intégrale impropre comme la 
écédent ède en deux t On majore f[{°° SU) q i peut se faire ainsi : 
précédente on procède en deux temps. On majore |;  —dx, ce qui peut se faire ainsi : 


[7 sin(x) dx = cos(X) [7 cos(x) dr 


X T X X x? 


La dernière intégrale est majorée,en valeur absolue, par ri dr/x? = 1/X donc on à 
['É 5% #0) qr| < 2/X. Ensuite on calcule une valeur À I de [* SM) y à € près, 


par de par la méthode des trapèzes et on conclut que | Fr or —[| <e+2/X. 


FA 


LS I PSS 


NORGE #5 


ET 


FOSSES, 


ja Niels (1802- 1829) 
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CHAPITRE 19 COURBES PARAMÉTRÉES ET DÉVELOPPEMENTS 
LIMITÉS 


L'objet de ce chapitre est l’étude du comportement local (i.e. au voisinage d’un point) 
des courbes. Le premier paragraphe est consacré à des techniques de calculs de limites ou 
d’équivalents. Par exemple les deux limites suivantes 

cos(x) — 1 e? —2V/1+x+1 
m a —————"_— 
2 


et lim 
z—0 æsin(x) æ—0 x 


ne sont pas accessibles avec les méthodes développées avant ce chapitre ; le calcul des 
développements limités permet d’y remédier. La deuxième partie est consacrée à l’étude 
des courbes proprement dites ; plus précisément on étudie des courbes un peu plus générales 
que les graphes de fonctions et qui interviennent souvent par exemple en cinématique ou en 
mécanique (où les coordonnées d’un mobile sont connues en fonction du temps). L'exemple 
le plus basique en physique est le mouvement d’un solide soumis à la gravitation : avec 
les notations usuelles en physique F = m7 donc —-mg = my" et 0 = mx” d’où y(t) = 
—gt?/2 + y'(0)t + y(0) et x(t) = x/(0)t + (0), ce qui détermine une parabole. 


19.1 DÉVELOPPEMENTS LIMITÉS 


Notation : on désignera dans tout ce chapitre par £(x) une fonction définie au voisi- 
nage de 0 et tendant vers 0 lorsque x tend vers 0. 


Définition: Une fonction f : 1 — R admet un développement limité (DL) à l’ordre n 
au voisinage de xo € L si il existe une fonction polynôme P(x) = ao + a1(x — æo) +... + 
an(x — to)” tel que 

f(x) = P(x) + (x — x0)"E(x — x) 


Exemple : une fonction admet un DL en un point x0 d’ordre 1 si et seulement si elle est 
dérivable en ce point. 


Remarque sur les notations : nous nous contenterons de la notation e(x) qui désignera 
dans tout ce chapitre une fonction tendant vers zéro quand x tend vers zéro (qui ne sera pas 
toujours la même!). Plusieurs auteurs utilisent (au moins) deux autres notations que nous 
signalons donc : la notation O(x") (“grand ©”) désigne une fonction bornée en valeur 
absolue par C|x|” lorsque x tend vers zéro ; la notation o(x"”) (“petit o”) désigne une 
fonction dont le quotient par x” tend vers zéro quand x tend vers zéro. 


PROPOSITION: Un développement limité d’ordre n, si il existe, est unique. 


Démonstration: Supposons que f(x) = P(x) + x"e(x) = Q(x) + x"n(x) où P,Q sont 
des polynômes de degré < n et €, n tendent vers zéro quand x tend vers zéro. Alors, si le 
polynôme P — Q n’était pas nul, la fonction (P — Q)(x) serait équivalente à une fonction 
ax” avec a Z 0 et 0 <r < n et ne pourrait être égale à une fonction du type e(x)x” car 
lim 20. on 


axT 


Remarque : l’unicité permet de simplifier certains calculs car elle entraîne qu’une 
fonction paire (resp. impaire) n’aura que des termes de degré pair du type x?" (resp. 
impair du type x?"**1) dans un développement limité. 
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La méthode la plus courante pour montrer l’existence des DL est d'utiliser la formule 
de Taylor qui entraîne que : 


THÉORÈME: (Formule de Taylor-Young)Soit f une fonction n fois continument 
dérivable sur un intervalle T contenant x0, alors 


1! x Fi) x : " 
Se) = f(e0)+ Pro) 20) + 0 72024 + ED) (0) + (ao) (20) 
Démonstration: Quitte à faire une translation, on peut supposer que æ0 = 0. La 
formule de Taylor-Lagrange s’écrit : 
(0 (n) c 
fe) = 50) + PO + Ua +... + Or 


avec c compris entre 0 et x. Ainsi lorsque x tend vers zéro, c tend aussi vers zéro et 
comme f(%) est continue f(%)(c) — f(M)(0) tend vers zéro quand x tend vers zéro donc 
FU (c)a = FU (0)x" + E(x)x" ; en reportant dans la formule de Taylor-Lagrange, on 
obtient le résultat escompté. 


Par application directe on trouve : 
COROLLAIRE: Les fonctions e”, cos(x), sin(x) et (1+x)® admettent les DL suivants : 


T 4 nm 
e =l+ts+ts ++ +s E(x) 


2! 
x? x“ à x?" _. 
cos(x) SR TI LE ee) GATE E(x) 
| x x° ” a?29+1l De 
— 1 —1)...(a— 1 
Gta =i+ar+ De, ae ) ue Se ln 

— 1 1 7 —24/1 [38 

Exemple d'utilisation : lim lee, = —- et lim = VAR = —. 

z—0 % sin(x) 2 æ—0 x? 4 
En effet cos(x)—1 = —x?/2+x°e(x) et xsin(x) = x?+x°e(x) donc nt = —)+c(x) 


tend vers —. Par ailleurs VI +x = 1+x/2 — x?/8 + x°e(x) donc e° —2V1 +x +1 = 
(1+x+x°/2) —2(1+x/2 — x?/8) +1 + x°e(x) = x? + x°e(x) d’où la deuxième limite. 


THÉORÈME: Soient f,g deux fonctions continues de variables réelles dont on suppose 
qu’elles admettent un DL à l’ordre n de la forme : f(x) = ay+aix +...+a,x" +e(x)x" = 
P(x) +e(x)x” et g(x) = bo + br +... +b,x" + e(x)x" = Q(x) + e(x)x” 

(i) (Somme) La fonction f + g admet un DL à l’ordre n en 0 qui s'écrit : 


(f + g)(x) = (ao + bo) + (a1 + b1)r +... + (an + bn)r" +E(x)x" 
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(ii) (Produit) La fonction fg admet un DL à l’ordre n en 0 qui s'écrit : (fg)(x) — 
Co +... +" +e(x)r" avec c; = Do axbi-k 

(ii) (Quotient) Supposons bo # 0 (c'est-à-dire g(0) 0) alors la fonction f/g admet 
un DL à l’ordre n en 0 qui s'écrit : (f/g)(x) = co +...+cnx" +e(x)x" avec des c; que 
l’on peut déterminer par la relation a; = D 50 Ckbi-k. 

(iv) (Composée) Supposons bo = 0 alors la fonction f o g admet un DL à l’ordre n en 
0 qui s'écrit : (f o g)(x) = R(x) +e(x)x” où R(x) est le polynôme P o Q(x) auquel on a 
retiré les termes de degré > n. 

(v) (Intégration) Soit F(x) une primitive de f alors elle admet un DL d'ordre n +1 
qui s'écrit F(x) = F(0) + aox + a1x°/2 +... + ant tt/(n +1) +e(x)ztt. 


Démonstration: Les deux premiers énoncés s’obtiennent immédiatement en addition- 
nant ou multipliant les DL de f et g. Les points (iïi) et (iv) sont également un simple 
calcul si l’on admet l’existence d’un DL, qui est un peu plus délicate à prouver et que 
nous admettrons. Enfin le dernier point s’obtient par intégration du DL de f(x) ; en effet 
Jo tdt = 2%1/(m + 1) et, si l’on note 7(x) = supselo le (t)|, on à : 


amtl 


(m +1) 


| | e(br'at Sent | pente 


d’où le résultat. © 


APPLICATION: Par application directe on obtient les DL suivants : 


E-% x" 
log(1 Er) = = 4 EE (I) e(r) 
2 3 n 
x a27+l 
Arctg(x) =T — 3. +... + re + ef) re 
qe nn "Éd 2n+1 
Di: DE 6 
te(x) =x + + 
g(x) =x + 3 + 15 + Ee(x)x 


Par la formule de Taylor on a calculé le DL de (1+x)-! et de (1+x) 1/2 Le premier 
s'obtient en intégrant le DL de 1/(1 + x) ; en utilisant le DL d’une fonction composée on 
obtient le DL de 1/(1+x?) et (1+zx2) !/2 et en intégrant on obtient le DL de Arctg(x) et 
Argsh(x). En utilisant la formule de Taylor et le fait que la fonction tangente est impaire, 
on sait que tg(x) = cx + c3x° + c5x° + ex) ; on peut déterminer les coefficients c; soit 
en calculant les dérivées successives de tg soit en utilisant les DL de sin(x) et cos(x) et la 
règle pour le quotient de deux DL. 


19.2 COURBES PARAMÉTRÉES 


Définition: On appelle courbe paramétrée une application de Z dans R? où J est un 
intervalle ou une union d’intervalles. 
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Notation : on écrira en général M{(t) = (x(t), y(t)) le point du plan donné par la valeur 
t du paramètre. 

Remarque : d’après la définition il faudrait distinguer l’ensemble © = {{x(t),y(t)) € 
R?|+#€ I} - qui correspond à l’appellation usuelle de courbe- et la courbe paramétrée 
elle-même qui est l’application t + (x(t),y(t)) ; mais, conformément à l’usage, on dira 
aussi que la courbe C est paramétrée par l’application. En particulier une courbe (au 
sens usuel) peut être paramétrée de diverses façons. De nombreux problèmes conduisent 
à des courbes paramétrées, commençons par donner des exemples de paramétrisations de 
courbes simples. 


Exemples : 

1) La courbe paramétrée définie par x(t) = at +b et y(t) = ct + d est une droite dont 
la pente est c/a. 

2) L’ellipse d’équation x?/a? + y?/b? — 1 peut être paramétrée de plusieurs façons : 
d’abord à l’aide de fonctions circulaires : M(t) = (acos(t),bsin(t)) mais aussi à l’aide de 
fractions rationnelles : si l’on coupe l’ellipse par la droite de pente t passant par le point 
(a, 0) on obtient (après un petit calcul) un point 


M() a?t? — b? ; a?t? — b? at? —b? —2ab°t 
HAE DE NS ar Ge AE 0 


Ceci fournit une paramétrisation de l’ellipse moins le point (a, 0) qui n’est pas atteint. 


Remarque : ces deux paramétrisations peuvent bien sûr être reliées. Explicitons cela 
dans le cas du cercle avec a = b = 1. Le point (5 F4) correspond à (cos(0),sin()) 
lorsque t — — tg(0/2). 

Nous nous concentrons maintenant sur l’étude et le tracé des courbes paramétrées. 


Déterminons, dans certains cas, la pente de la tangente d’une courbe paramétrée : 


THÉORÈME: Soit t — (f(t),g(t)) une courbe paramétrée par un intervalle I (avec 
to € Î) ; supposons les deux fonctions f et g continûment dérivables en t, et telle que 
f'(to) À 0 alors la pente de la tangente, au point M(to) = (f(to),g(to)) de la courbe 
paramétrée, est donnée par 


Démonstration: Pour fixer les idées, disons que f’(to) > 0 alors f’(t), étant continue, 
reste strictement positive sur un (petit) intervalle Ja, b] contenant to et donc f détermine 
une bijection de ]a,b[ sur un autre intervalle ; notons À := f7! la bijection réciproque, 


El 


on sait que si t — h(x) alors h’(x) = 1/f'(t), de plus on aura alors y = go h(x) et 
dy/dz = g'(h(x))h'(x) = g'()/f'(). 0 

Remarques : 
dy dy / dx 
dr dt’ dt 

ü) Si f’(to) = 0 mais g/(to) Z 0 alors, en intervertissant les rôles des coordonnés on 
voit que la pente est verticale. Ceci nous laisse à traiter le cas où f’(to) = g'(to) = 0. 


i) Mnémotechniquement on pourra utiliser : 


Définition: Le point to € I (ou Z est un intervalle) est dit singulier pour la courbe 
paramétrée M : I — R? donnée par t + (f(t),g(t)) si f'(to) = g'(to) = 0. 


Pour étudier un point singulier, nous allons utiliser les DL des fonctions f,g au voisi- 
nage de to (quand ils existent). 
Notation : si f(t) = ao + ait +... ant” +e(t)t" et g(t) = bo + bit +... bat +e(t}t”, 


notons M(t) = ci et e;j — o ) nous écrirons : 


M(t) = eo +tei +...+t"en +t'e(t) 

où e(t) désignera un vecteur dont les coordonnées tendent vers 0 quand t tend vers 0. On 
introduit aussi la notation M'(t) = on et plus généralement M) (+4) — Go ): 
On obtient alors, sous l'hypothèse que f et g sont suffisamment dérivable une formule de 
Taylor-Young vectorielle : 


( . to) ( se to)? 1! 

ï M (o)+.. + 
THÉORÈME: Soient m < n les plus petits entiers tels que les vecteurs M(")(to) 
et M) (t) soient linéairement indépendants, notons e; = M(")(t5) et e = MÜ)(to) et 
supposons que det(e1,e2) > 0, alors l’allure de la courbe paramétrée au voisinage de M(to) 
est la suivante : 


tu M (to)+(t—t0)"e(t—t0) 


M(t) = M(to)+ M(to)+ 


m, n impairs m impair, n pair 


m pair n impair m pair, n pair 
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Si det(e1,e2) < 0, il faut opérer une symétrie (par rapport à la droite engendrée par e:) 
pour obtenir l’allure de la courbe au voisinage de M(to). 


Démonstration: (esquisse) Après éventuellement une symétrie et à un changement 
de repère près (qui ne modifie pas l’allure du graphe) on peut se ramener à étudier les 
courbes M(t) := (#”,1") ce qui est relativement aisé : si m est impair on aura { = x!/" 
et la courbe est le graphe de la fonction f(x) — Cm)", c’est-à-dire : 


Si m est pair alors æ >0et, pourt >Oonat=x!/" et y = Ge? alors que pour 
t<0,onay—=(-1)" Cie c’est-à-dire : 


Comme illustration, incluons l’exemple suivant dont les détails sont laissés en exercice. 
On veut étudier le comportement au voisinage de t — 0 de la courbe M(t) = (x(t), y(t)) = 
(#2 +4,42 +45). On a M'(0) = M"(0) = 0 et M'"(0) = (2,2) indépendant de M(4)(0) — 
(24,40). Pour déterminer la position de la demi-branche “ > 0” par rapport à celle “ < 0” 
on observe qu'ici, x(t) = x(—t) et que, pour t > 0 on a y(t) = y(—t) + 1045 > y(—t) d'où 
l’esquisse suivante : 


Passons maintenant à l’étude pratique d’une courbe paramétrée ; un plan général 
d'étude possible est le suivant 


— Détermination du domaine, des périodes et des symétries éventuelles ; 
— Calcul de x/(t) et de y/(t), tableau de variations, asymptotes : 

— Etude des points singuliers, calcul de quelques tangentes ; 

— Détermination des points doubles ; 

— Représentation graphique. 


Plutôt que de faire une étude théorique, illustrons cela sur un exemple : 


Etudions la courbe : 
a(t) ÉF ) 
M(t) = = 
(6) ce) ee 


— Les fonctions æ(t) et y(t) sont définies pour t € R \ {1} ; il n’y a ni période ni 
symétrie apparente. 
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— On calcule x'(t) = (t—3)(t+1)/(t—-1)? et y'(t) = (t—3)(t2+3)/(t—-1) donc le point 
5) 
5) 
a une tangente verticale. Les limites de x(t) et y(t) lorsque t tend vers 1 ou + sont 
faciles à calculer ainsi que les sens de variation ; on résume ceci dans un tableau : 


correspondant à { = 3 c’est-à-dire M(3) — est singulier, et le point M(—1) = ei 


t —00 A [> ii 3 + 00 
æ'(t) + O0  — ME 
—3 +00 +00 
x(t) Pa Le ÈS 7 
—00 —O0 5 
+00 +00 +00 
y(t) 6 Le 4 
_o 5 
y'(t) + Æ 0 se 


Pour déterminer si la courbe admet une asymptote lorsque t tend vers 17 ou vers 
+oo on calcule le rapport y(t)/x(t) = & —#? -+t+5/(t—1)(f —-+t+4). Ce rapport ne 
tend pas vers une limite finie lorsque t tend vers 1 donc il n’y a pas d’asymptote dans 
ce cas. Par contre lim, y(t)/x(t) = 1 et donc s’il existe une asymptote elle sera de la 
forme y = x + b ; donc il nous faut maintenant voir si y(t) — x(t) tend vers une limite 
finie : y(t) — x(t) = 1 + 4/(t — 1)? — 4/(t — 1) tend vers 1 donc la droite y = x + 1 est 
asymptote ; de plus si t tend vers +oo on a y(t) — x(t) — 1 < 0 et si t tend vers —-o on 
a y(t) — x(t) — 1 > 0 donc dans le premier cas la branche de la courbe est au dessous de 
l’asymptote et dans le deuxième cas elle est au dessus de l’asymptote. 

— On étudie le comportement de la courbe au voisinage du point singulier M(3) — 


él : on calcule tout d’abord M'(3) — 0 (bien sûr) puis M”(3) ) et ensuite 


; 1 
132 
MB )= ) Ces deux derniers vecteurs sont linéairement indépendants et un 


calcul immédiat montre que det(M”(3), M'"(3)) < 0. Ceci permet donc de déterminer 
l'allure de la courbe au voisinage de A/(3) : 


— I n’y à pas de point double, c’est-à-dire que les équations x(t) = x(s) et y(t) = y(s) 
entraînent t — s. Vérifions cela : t + 4/(t — 1) = s + 4/(s — 1) équivaut à (£ — s) — 
At — s)/(s — 1)(t — 1) donc à t = s ou (s — 1)(t — 1) = 4. Par ailleurs t + 1 + 4/(t — 
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1}? = 5 +1+4/(s — 1)? équivaut à (4 — s) — A(s — t)(s + t — 2)/(s — 1)?(t — 1)? donc 
àt=sous+t — 2+(s—1)?(t —1)?/4 Si l’on exclut t — s on aboutit à ce que 
(s—1)(t—1)=4et (t —1)+(s —1) = 4 ce qui signifie que s — 1 et t — 1 sont les racines 
de X?—4X +4—(X — 2)? — 0 ce qui entraîne s = t = 3. 

— Avant de tracer la courbe, notons que l’on peut préciser un peu le comportement 
de la courbe quand t tend vers 17. En effet on observe que 


(2) =e-0a-t-0/4 


donc lorsque t tend vers 1, la courbe se rapproche de la parabole d’équation y = (x —1)?/4. 
On peut même préciser que lorsque t — 1* la courbe est au dessus de la parabole et lorsque 
t — 1 la courbe est au dessous de la parabole. On généralise, sur cet exemple, la notion 
de courbe asymptote : on se contente souvent de rechercher les droites asymptotes, mais 
on peut rechercher plus généralement des courbes asymptotes. 

— On peut aussi calculer les points d’intersection de la courbe avec l’asymptote y — 


x +1, on trouve t = 2 et M(2) = ainsi que les points d’intersection avec la parabole 


6 
É 
_1\2 6 
y—(Æ), on trouve t =5 et M(5) = a 
On peut maintenant tracer le graphe de la courbe que l’on vient d'étudier (voir page 
suivante). 


Comme autre exemple on décrit très succintement l’étude de la courbe (il s’agit d’un 
exemple de courbes dites de Lissajoux). 


x(t) sin(2t) 
M = — 
(4) pi ee. 
La “caractéristique” de cette courbe est de posséder beaucoup de symétries; mettons en 
évidence les principales symétries. 


— On a bien sûr M(t+27x) = M(t) donc la courbe est périodique et il suffit de l’étudier 
pour t dans un intervalle de longueur 27. 
Li . ( x(t) 
yG+x)) y) 
de longueur x, on obtiendra la courbe complète par symétrie par rapport à l’axe des x. 


— On a aussi te ) = e. ) donc on peut prendre un intervalle centré en 0 et 
le réduire de moitié, on obtiendra la courbe complète par symétrie par rapport à l’axe des 


U. 


— On remarque aussi que ( ) donc on peut prendre un intervalle 


175 


4 4 
Tracé de la courbe M(t) = (x(t),y(t)) = (: +4, t+1+ Fr) | 
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— Après avoir fait un tableau de variations (ce qui est laissé en exercice), on peut 
tracer la courbe (en trait continu la partie correspondant à t € [0,7/2], en pointillé le reste 
de la courbe obtenu par symétrie) : 


Tracé de la courbe M(t) = ei = ee ) 


Nous laissons en exercice le soin de déterminer les sept points doubles (si l’on restreint 
le paramètre t à l'intervalle [-7, +xl|). 


Remarque : on peut observer cette courbe sur l’écran d’un oscilloscope à condition 


d'y entrer deux tensions dont les fréquences sont dans un rapport à (ou 3). 


A C-RGAUSS 17771855 


F BUNDESPOST 


Gauss Carl Friedrich (1777-1855) 


L'ET 


CHAPITRE 20 EQUATIONS DIFFÉRENTIELLES 


Îl y a peu de concept mathématique aussi universellement utilisé dans les autres scien- 
ces que celui d’équation différentielle. On les retrouve aussi bien en biologie, en chimie 
qu’en économie. Newton disait que traiter mathématiquement un problème physique revient 
à trouver l'équation différentielle qui le décrit. Il n’y a donc que l’embarras du choix pour 
donner des exemples de modélisation de phénomènes par des équations différentielles. Ob- 
servons que dans ce contexte l’idée d’unicité — qui apparaît si importante au mathématicien 
et parfois si inutile au profane- révèle son importance : si la solution est unique, on peut 
espérer que les équations que l’on a écrites décrivent complètement le phénomène. Remar- 
quons qu'il serait aussi illusoire de penser que l’on peut “résoudre” toutes les équations 
différentielles explicitement. En effet nous avons déjà mentionné que des équations comme 
ÿ = e®° n'avait pas de solution “élémentaire” ; on peut raffiner la question en s’autorisant 
les quadratures (i.e. on s’autorise à prendre des primitives), la réponse est de nouveau 
négative : cela ne suffit pas pour exprimer les solutions des équations différentielles en 
général. Il est donc important de développer une étude qualitative des équations différen- 
tielles ; nous abordons très succintement ce thème dans le premier paragraphe avant de 
nous concentrer sur des types très importants d'équations que l’on sait en fait résoudre 
explicitement. 


20.1 INTRODUCTION, EXEMPLES 


On donne quelques exemples d'équations différentielles et quelques considérations géo- 
métriques sur ces équations. 


Commençons par donner une définition (un peu restrictive) d’une équation différentielle : 


Définition: Une équation différentielle d'ordre n est une équation de la forme : 


go = (y D... y y,x) 


Une solution de l'équation différentielle est une fonction g : 1 — R qui est n fois dérivable 
et vérifie 9) (x) = f(g®-D(x),..….,g'(x), g(x),x) 


Remarques : 

i) Si g : 1 — R est une solution et si J C I alors visiblement la restriction de g à 
J est encore une solution, mais cela ne nous apprend rien sur l’équation ; on conviendra 
donc de ne s'intéresser qu'aux solutions maximales, ï.e. les solutions qui ne sont pas des 
restrictions de solutions définies sur des intervalles plus grands. 

ii) Le cas “général” serait plutôt une équation du type f(y0),y0r0) y ,y,æx) = 0. 

ii) Il est clair qu’une tel équation n’a presque jamais une solution unique (penser au 
calcul de primitives i.e. aux équations du type y = f(x)) ; l'intuition physique peut nous 
guider : pour espérer avoir unicité des solutions il faut rajouter des conditions initiales, 
c’est-à-dire connaître y) (x5),...,y/(xo), y(ro) : par exemple pour une équation de la 
mécanique de Newton qui fait intervenir dérivée première (vitesse) et dérivée seconde 
(accélération), il faut connaître la position et la vitesse initiales d’un solide pour connaître 
son mouvement. 
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EXEMPLES : Etudions les solutions de l’équation : y = y. 

Soit 1 un intervalle où une solution y ne s’annule pas, alors on peut réécrire l’équation 
y'/ &/y = 1 ce qui équivaut à 2y2/3 = x—C' soit encore y — (4(x — Cr On obtient ainsi 
des solutions sur tout intervalle [C, +). Par ailleurs y = 0 est une solution évidente ; ceci 
permet de décrire un certain nombre de solutions ; nous nous contenterons de les dessiner 
et d'observer que l’équation n’est pas “déterministe” : si disons y(0) — 0, rien ne permet 
de dire quand y “décollera” pour prendre des valeurs positives. 


On n’a tracé que des solutions positives ; on peut en obtenir d’autres en utilisant la 
symétrie : si y(x) est une solution, alors y1(x) := —y(—x) est également solution. 


L’équation précédente est un cas particulier des équations à variables séparées ï.e. 
celles que l’on peut écrire sous la forme 


f(y)y! = g(x) (E) 


Pour chercher les solutions de (Æ), on introduit F une primitive de f et G une primitive 
de g. Si y(x) est une solution de (ÆE) alors F(y(x)) = G(x) + K (où K désigne une 
constante). Si on se place sur un intervalle où F définit une bijection, on poura alors écrire 
y(x) = F1 (G(x) + K). A titre d'exemple étudions l'équation 


sin?(x)y" — cos(x)y? = 0 


En se plaçant hors de x = 0 et la où y(x) Z 0, on peut réécrire l’équation y/y? — 
cos(r)/sin?(x) qui donne —1/y(x) = —1/sin(x) + K d’où y(x) = sin(x)/(1 — Ksin(x)). 


Considérations géométriques 


Définition: Un champ de vecteurs dans le plan est la donnée en chaque point du plan 
d’un vecteur du plan ; en d’autre termes c’est une application de R? dans R?°. 


Le champ de vecteur v(x,y) = (x,x + y?) 

Le lien avec les équations différentielles est donné par l’observation suivante : si on 
souhaite étudier une équation différentielle du type y = f(x,y), on définit un champ de 
vecteur en choisissant en chaque point (x, y) un vecteur de pente f(x,y). Alors il est clair 
qu’une solution de l’équation différentielle est une courbe tangente en chaque point au 
champ de vecteurs. 
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On peut représenter cela ainsi 


Ceci permet déjà une certaine analyse qualitative des solutions. Par exemple le tracé 
des courbes f(x,y) — a découpe le plan en région dans lesquelles la pente des solutions 
est < a ou > a ; en particulier la courbe f(x, y) = 0 partage le plan en plusieurs parties : 
celles où les solutions sont croissantes et celles où les solutions sont décroissantes. 


Donnons des exemples de propriétés géométriques vérifiables par le calcul et par le 
dessin du champ de vecteurs. 


Champ associé à y = ay +b 


L’allure des solutions sera confirmé au prochain paragraphe où l’on verra qu’elles sont 
de la forme y(x) = Àe%? — b/a 


Champ associé à y’ = f(x) 
Vu le parallélisme du champ de vecteur on voit que si y(x) est solution y(x) + C 
également ; ceci est clair car y doit être une primitive de f 
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Champ associé à y — f(y) 
Vu le parallélisme du champ de vecteur on voit que si y(x) est solution y(x + C) 
également ; ceci est clair car x doit être une primitive de y//f(y). 


Exemples de modélisation par des équations différentielles : 


1) Une piscine de 40000 litres a son eau renouvelée au rythme de 200 litres par heures. 
Par accident l’eau de regénération est polluée avec une concentration de 5% par un produit 
toxique dont on sait qu’une concentration supérieure à 3% peut être dangereuse. Comment 
varie la concentration du produit toxique en fonction du temps, la concentration dangereuse 
est-elle atteinte? Au bout de combien de temps? 


Modélisation : appelons y(t) la concentration et Y(t) — 40000y(t) la quantité (en 
litres) du produit toxique dans la piscine. Considérons un “petit” accroissement du temps 
h, alors Y(t+h) est égal Y (t) augmenté de 200 x 0,05 x h (la quantité de produit déversé 
durant l’intervalle de longueur h) et diminué de 200 x y(t) x h ; ici on néglige des termes 
du second ordre (par rapport à h), i.e. on fait l’approximation que la concentration est 
constante, cette approximation est justifié (au moins intuitivement) car on va faire tendre 
h vers zéro. On obtient donc Y(t + h) = Y(t) + 10h — 200y(t)h d’où en faisant tendre À 
Vers ZÉTO 

Y’(t) +0,0005Y (4) = 10 


On verra (il s’agit d’une équation linéaire du premier ordre avec coefficients constants) que 
les solutions sont de la forme Y (4) = Ce 0005 + 2600 et donc si Y (0) = 0 (eau non polluée 
avant l’accident) on obtient Y (t) — 2000(1 — e 0005) et y(#) = 0,05(1 —e°:005t), L'étude 
du champ de vecteurs associé donna d’ailleurs l’allure de ces courbes. On voit ainsi que la 
concentration tendra vers 5% avec le temps et atteindra 3% au bout de 200 log(2, 25) + 183 
heures. 


VARIANTE : L’amiante est un poison dont l’inhalation provoque diverses maladies 
pulmonaires dont des cancers mortels (cancers broncho-pulmonaires, et mésothéliomes de 
la plèvre et du péritoine) dont le temps de latence est particulièrement long (respectivement 
30 ans et 40 ans en moyenne) ; heureusement on n’est pas pressé! Sachant que l’air qu’on 
respire à Jussieu contient de l’ordre de quelques fibres par litre, que l’être humain respire 
plusieurs milliers de litres d’air par jour, que la concentration de fibres d’amiante dans l’air 
peut être multipliée par 50 par l’activité dans une pièce, par 500 lors de travaux dans les 
faux-plafonds (passage de câbles, réparation de circuit électrique, de canalisation), sachant 
que l’on ignore s’il existe un seuil au dessous duquel l’amiante cesse d’induire des cancers, 
pouvez-vous évaluer, à l’aide d’une équation différentielle, le risque encouru à Jussieu 1) 
par un étudiant (qui passe en moyenne 3 à 4 ans à l’université), 2) par un enseignant ou 
administratif (qui y travaille de façon permanente) 3) par un agent de maintenance ou de 
nettoyage (qui sera amené à opérer dans les faux-plafonds ou à nettoyer après)? 
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2) Si on considère qu’un ressort exerce une force proportionnelle à l'éloignement du 
solide qui lui est attaché, l’équation de la mécanique F = my se traduit ainsi, en notant 
y la position du solide, m sa masse, 0 le point de fixation du ressort et k le rapport de 
proportionalité donnant la force exercée : —ky = my". 


Posons w := 4/k/m alors l’équation s'écrit : 
y" + w?y =\f) 


Nous verrons que les solutions de cette équation sont du type y(t) = Asin(wt) + B cos(wt) 
ou si l’on préfère y(t) = C'cos(wt + ). Ceci permet de voir que les oscillations restent 
bornées (d'amplitude C) et périodiques (de période 27 /w) ; on peut aussi constater que la 
connaissance de la position et vitesse initiale (disons y(0) et y/(0)) permet de déterminer 
entièrement le mouvement du solide (B = y(0) et A = y'(0)/w). 


L'étude d’un circuit électrique “RLC” (avec résistance, inductance et capacité) conduit 
à des équations du même type. 


3) On considère un pendule de longueur £, de masse m accroché en un point © et on 
note y l’angle que la tige du pendule fait avec la verticale ; comme dans cette figure : 


L’équation de la mécanique F = m7 se traduit par —mgsin(y) = m£y” (où g est la 
constante universelle de gravitation) et en posant w := 4/g/£ on obtient : 


y” + w? sin(y) = 0 


Cette équation est nettement plus compliquée que les deux précédentes car elle n’est pas 
linéaire en y et l’on ne sait pas exprimer ses solutions par une formule. On peut néanmoins 
l’étudier qualitativement, par exemple essayer de savoir si il y a des solutions périodiques ou 
si une solution doit être périodique. Ces problèmes sont difficiles et nous nous contenterons 
d’observer que si les oscillations du pendule sont suffisamment petites, on aura sin(y(t)) 
y(t) et “donc” que les solutions de l'équation y” + w?y = 0 représenterons une bonne 
approximation des solutions de l’équation différentielle originale. 
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20.2 ÉQUATIONS DIFFÉRENTIELLES LINÉAIRES DU PREMIER ORDRE 


Il s’agit des équations du type y = a(x)y + b(x). Une observation simple a montré 
que le champ de vecteurs associé à une forme simple au dessus de chaque intervalle où le 
signe de a(x) est constant. On va voir que l’on peut en fait résoudre par quadrature ces 
équations. 

Commençons par observer que l’ensemble des solutions forme un espace affine ; c’est-à- 
dire que si y, est une solution et y en est une autre alors y— est solution de l’équation 2° = 
a(x)z. Or l’ensemble des solutions de cette dernière équation différentielle est visiblement 
un espace vectoriel. 

Définition: On appelle équation différentielle homogène associée à l’équation y! = 
a(x)y + b(x), l'équation y’ = a(x)y. 

Ainsi toute solution d’une équation différentielle linéaire du premier ordre est somme 
d’une solution particulière et d’une solution de l’équation homogène associée. 

Commençons par la résolution de l’équation homogène (remarquez qu’il s’agit d’une 
équation à variables séparées) : 


THÉORÈME: Soit (to, Yo) € R? et soit a : I — R une fonction continue avec x9 € I ; 
il existe une unique solution de l’équation différentielle y! — a(x)y telle que y(xo) = Yo ; 
celle-ci est donné explicitement par 


y(x) := yo exp ([ atrt) 


La solution générale de l’équation différentielle est y(x) — C'exp (A(x)) où A(x) désigne 
une primitive de a(x). 

Démonstration: On vérifie facilement que la fonction annoncée est une solution ; in- 
versement, si y est une solution, posons 2(x) := y(x) exp (- jee a(t)dt) alors z est dérivable 


et un calcul direct donne 


LA 


2x) = (y/(e) — a()y(æ) exp (- ! at) _0 


0 


d’où z(x) = Cet on trouve donc y(x) = C'exp de a(t)dt). Imposer la condition y(xo) — 
yo revient alors à imposer C = yo. D 

Exemples : soient À, b des réels non nuls, on se restreint à x € R*, alors l'équation 
y! = ÀAx°y a pour solution y(x) = C'exp (4) si b £ —1 et y(x) = Cr” si b = —1. 


Passons à la recherche d’une solution particulière pour une équation du type 
y" = a(x)y + b(x) 


Dans certains cas il est facile de trouver une solution simple ; par exemple l’équation 
différentielle y = Ày + u admet visiblement comme solution particulière y = —u/X par 
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conséquent la solution générale de l'équation est y(x) = Ce — u/X. Toutefois il se peut 
qu'aucune solution ne soit “visible” et alors il est utile de recourir à une méthode générale 
dite de “variation de la constante” (sic). 


L'idée est la suivante : l'équation homogène a pour solution y1(x) = C'exp ( Ii a(t)dt) 


et on va chercher une solution y sous la forme y(x) = C'(x) exp ( a(t)dt). 


THÉORÈME: Soit (to, Yo) EL XR et soit a,b : I — R deux fonctions continues ; il 
existe une unique solution de l'équation différentielle y! = a(x)y+b(x) telle que y(xo) = Yo ; 
celle-ci est donné explicitement par 


y(x) := yo exp ( | | 107) à | Lo exp (- J ‘atudu) dt 


La solution générale de l’équation différentielle est obtenue en faisant varier Yo. 


Démonstration: Soit y une solution de l’équation différentielle étudiée, posons C{x) :— 
y(x) exp (- pe a(t)dt) : alors 


CD = (9 — atovto)exp (- Jatodt) = teen (- fat) 


0 0 


donc si on désigne par y1(x) la fonction exp ( a(t)dt) on obtient C(x) = Co + Le Ro 
æ b(t)dt 


et y(x) = Coyi(x)+yi(x) fe (D: Inversement il est facile de vérifier qu’une telle fonction 


est bien solution de l’équation différentielle. La condition y(xo) = yo équivaut à Co = Yo. 
( 


Exemples 

Considérons l’équation y = 2xy + 1 alors le calcul donne (en prenant æ9 — 0) 
une solution homogène y1(x) = C'exp(x?) et une solution générale y(x) = C'exp(x?) + 
exp(x?) fo exp(—t?)dt. 

L’équation y = —2y/x + e* a pour solution homogène y1(x) = C{x| ? et, sur 
chacun des intervalles (—co,0| et ]0,+00), la solution générale s’écrit y(x) = C|x| ? + 
LR 12 et’dt ou encore 


y(x) = Cr? + (1- 2x7 +2x 7) e? 


20.3 ÉQUATIONS DIFFÉRENTIELLES LINÉAIRES DU SECOND ORDRE 


On s'intéresse maintenant aux équations différentielles linéaires du second ordre. On 
traitera plus particulièrement le cas des coefficients constants mais le début de la discussion 
est générale ne nécessite pas cette hypothèse. Il s’agit d'équations du type : 


y" +a(x)y + b(x)y = c(x) 
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La première observation est que de nouveau l’ensemble des solutions forme un espace affine 
et que toute solution sera somme d’une solution particulière et d’une solution de l’équation 
homogène correspondante 

y" +a(x)y" + b(x)y = 0 


Commençons par traiter l'équation homogène en montrant le théorème général suivant : 


THÉORÈME: Soit a,b : T — R deux fonctions continues, l’espace vectoriel des 
solutions de l'équation y” + a(x)y' + b(x)y = 0 à une dimension égale au plus à deux. En 
fait il existe au plus une solution telle que y'(xo) = y et y(xo) = Yo. 


Démonstration: Pour chaque paire de solutions y1,y2 fabriquons la fonction 


. yitx) Y(x) \ | Dr a 
mo de (UE 0) = Qué vu) 


Un calcul direct donne 
W'(x) — y1Y2 y yo — yi(—a(x)y2 — b(x)y2) — yo(—a(x)yi — b(x)y1) = —-a(x)W(x) 


donc W{(x) est elle-même solution d’une équation différentielle linéaire du premier ordre 
et donc Wi(x) = W(xo) exp (- he a(t)dt) : en particulier on a soit Vx € 1,W(x) Z 0 soit 
Vxz EI, W(x) = 0. 

Supposons qu’il existe deux solutions y1, y2 linéairement indépendantes (s’il n’en existe 
pas alors l’espace des solutions est de dimension < 1) ; on sait que (y1y2 — yiy2)(xo) Z 0 
donc pour toute autre solution y il existe À, u tels que y(x0) = ÀAyi(to)+uy2(to) et y'(xo) — 
Ay\ (to) + 1y(xo) (le système linéaire correspondant est de Cramer). Par conséquent la 
fonction W associée à y et Ay1 + uy2 est nulle et donc y est une combinaison linéaire de 
y1 et Ye. 


Le déterminant W considéré dans la preuve s’appelle le wronskien en l’honneur du 
mathématicien H. Wronsky. 


Remarquons que la démonstration contient des renseignements plus riches que ceux 
donnés dans l’énoncé du théorème ; on a en particulier montré : 


COROLLAIRE: Soit y1,y2 deux solutions de y” + a(x)y" + b(x)y — 0 telles que 
(y1y2 —yiy2)(to) 0 pour un point + alors y1 et y2 forment une base de l’espace vectoriel 
des solutions de l’équation différentielle. 


Exemple : on peut vérifier que sur RŸ les deux fonctions y1(x) = cos(V/x) et y2(x) = 
sin({/x) forment une base des solutions de 4x7” + 2y' + y — 0. Remarquons que pour 
appliquer la théorie précédente il faut d’abord diviser par 4x et donc travailler sur un 
intervalle de R*. De même une base des solutions sur R* est fournie par les deux fonctions 


ya(a) = exp (V2) et #1(&) = exp (V2). 


Nous allons maintenant considérer des équations avec a, b constants ; ce cas est très 
important d’abord parce que le principe général des développements limités nous a ap- 
pris que toute fonction assez régulière peut être approchée par une fonction linéaire donc 
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les équations linéaires, à coefficients constants, décrivent au moins localement le com- 
portement des solutions de beaucoup d’équation différentielles ; de plus un bon nombre 
de modélisations conduisent naturellement à des équations de ce type et elles présentent 
l’avantage qu’on peut décrire explicitement leurs solutions. 


Définition:  L’équation caractéristique associée à une équation différentielle y” + ay! + 
by = 0 est l'équation polynomiale X? + aX + b = 0 

Bien sûr cette notion est analogue à celle introduite pour les suites linéaires récurrentes 
(chapitre 12). 


THÉORÈME: Considérons l'équation différentielle à coefficients constants y” + ay! + 
by = 0 et appelons «1, a2 les racines de l’équation caractéristique associée. 

i) Si à1 £ à2 alors une base des solutions de l’équation différentielle est donnée par 
les fonctions x + e%? etre 

ii) Si «1 = à2 = à alors une base des solutions de l'équation différentielle est donnée 
par les fonctions x + e% et xt xe°. 

De plus dans le premier cas, si les coefficients sont réels et les racines complexes 
QG = u +iw et à = u — iw, une base de solutions réelles est donnée par les fonctions 
x + e"? cos(wx) et x + e“? sin(wx). 


CLEA 


Démonstration: D’après le théorème précédent, il suffit de vérifier que les deux 
fonctions sont solutions de l’équation différentielle (ce qui est immédiat à vérifier) et 
indépendantes en un point zo, mais dans le premier cas (y1Y2 — Yiy2)(xo) — (a2 — 
a )e(®1+a2)20 £ (et dans le second cas (y1y5 — yiy2)(ro) = e%* Z O.Pour la dernière affir- 
mation il suffit de se rappeler que e("+iw)r + e(u—iv)z — Jeu cos(wx) et e(u+iw)z _ Q(u—iw)z — 
2ie"* sin(wx). D 


Remarque : Le comportement général des solutions quand x tend vers l'infini est 
gouverné par les racines de l’équation caractéristique : si les racines vérifient Re(a;) < 0 
alors toutes les solutions tendent vers zéro quand x tend vers +oo ; si les racines vérifient 
seulement Re(a;) < 0 et sont distinctes, toutes les solutions sont bornées, lorsque x tend 
vers +00. 


La recherche d’une solution particulière de l'équation y” + ay’ +by = c(x) est possible 
par une variante de la méthode de la variation des constantes mais nous ne traiterons 
que le cas où c(x) est le produit d’un polynôme et d’une exponentielle (ou d’une fonction 
circulaire). 


THÉORÈME: Soit P(x) un polynôme de degré m alors il existe une solution partic- 
ulière de l'équation différentielle y” + ay! + by = P(x)e”* de la forme suivante : 


i) Si 82 + aB + b Z 0 on peut prendre y(x) = Q(x)eŸ* avec deg(Q) = m 


ü) Si BP? + af +b = 0 mais 26 + a Z 0 on peut prendre y(r) = Q(x)e** avec 
deg(Q)=m+1 


iii) Si B2+a8+b = 0 et 28+a = 0 on peut prendre y(x) = Q(x)e?* avec deg(Q) = m+2 


Démonstration:  Appelons E£, l’ensemble des fonctions f de la forme f(x) = P(x)e”® 
avec P polynôme de degré < m ; c’est un espace vectoriel de dimension m + 1 (il est 


186 


clairement isomorphe à l’espace vectoriel des polynômes de degré < m. et notons L 
l’application qui à f associe f” + af’ + f. On calcule 


L(f) = (P"+(28 + a)P' + (82 + a8 +b)P) eF* 


On voit tout de suite que L est donc une application linéaire de E,, vers En. 

i) Comme 6? + af +b £ 0, le degré de P” + (28 + a)P' + (6? + aB + b)P est égal à 
celui de P et donc L(f) = 0 équivaut à f — 0. L'application L étant injective doit être 
surjective, ce qui est la première affirmation du théorème. 

ii) Comme &? + af +b = 0 mais 28+aZ£0ona 


deg (P"+(28+ a)P'+(8° + aB +b)P) = deg(P) —-1 


ainsi l’image de E,, par L se trouve dans E,,-_: et le noyau de L est constitué des fonctions 
Ce? donc est de dimension 1 ; l’image Im(L) a donc même dimension que £,,_1 et lui est 
donc égale ; c’est-à-dire que pour tout polynôme P de degré m — 1 il existe un polynôme 
Q de degré m tel que L(Q(x)e?? = P(x)e”?. 

ii) Comme 8? +af+b=0et28+a—=0,ona 


deg (P" +(28 + a)P' +(8° + aB +b)P) = deg(P) — 2 


ainsi le noyau de L est constitué des fonctions (C1 + C2r)e°* donc est de dimension deux ; 
l’image Im(ZL) est de dimension m — 1 et contenue dans E,,-_2 donc lui est égale ; c’est-à- 
dire que pour tout polynôme P de degré m — 2 il existe un polynôme Q de degré m tel 
que L(Q(x)efT = P(x)ef®. © 


APPLICATION: (Résonance) Etudions le problème d’un ressort recevant une agita- 
tion périodique, ou d’un circuit électrique recevant un courant sinusoïdal. Un tel phéno- 
mène est décrit par une équation du type 


y” +w°?y = acos(px) + bsin(pr) 


Si p Æ uw alors y est la superposition d’une solution générale de l’équation différenti- 
elle homogène : Àcos(wx) + y sin(wx) et d’une solution particulière du type 7 cos(px) + 
5 sin(px) ; en particulier les solutions sont bornées. 

Si p = +w alors y est la superposition d’une solution générale de l’équation diffé- 
rentielle homogène : Àcos(wx) + usin(wx) et d’une solution particulière du type (ax + 
c) cos(px) + (bx + d)sin(px) ; en particulier les solutions ne sont pas bornées — ce qui veut 
dire que le ressort va casser ou que le circuit électrique va griller. Ce phénomène (le fait 
qu’un système possède une fréquence critique) s’appelle le phénomène de résonance ; c’est 
la raison pour laquelle les défilés militaires cessent de se faire au pas cadencé quand ils 
passent sur un pont. 


Remarquons aussi que pour chercher une solution particulière de y” + w?y = g1(x) + 
… + g,(x) il suffit de chercher une solution particulière y; de y” +w?y = g;(x) et ensuite 
d’additionner les y;. Par exemple si g;(x) = À; cos(w;r + @;) avec w? Z w? alors il y aura 
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une solution particulière de la forme yo(x) = C1 cos(wix + di) +... + CS cos(wsx + W). 
C’est le “principe de superposition”. 


Terminons ce chapitre en donnant un exemple d’équation différentielle (linéaire, à 
coefficients non constants) se ramenant à une équation différentielle linéaire à coefficients 
constants. 

Equation d’Euler : 

2°y" + axy + by = g(x) 
Plaçons nous sur R# (ou R*) avec € := sgn(x) = +1 et posons t := log |x| (donc x — £e!) 
et z(t) := y(£eï) ; on obtient aisément : z/(t) = cety'(eet) et z/(t) = e?ty/' (cet) + cety'(cet) 
d’où 2” +{(a—1)2'+bz = g(£et) qui est une équation linéaire à coefficients constants. Les 
solutions sont du type 2(t) = Ae%Ÿ+pe%zt+z5(t) (ou (A+ ut)e%* + z0(t)) où zo(t) désigne 
une solution particulière. On en tire les solutions de l’équation originale sur R* (ou R*) : 

(x) = A + url + 20 (log [x]) (ou (À + p log (21) 2] + zo (log |x|) 

Exemples : L’équation 227" + xy! + y = x +1 conduit à l'équation 2” + z = ef +1 et 
donc aux solutions de la forme : z{t) = Àcos(t) + sin(t) + €e!/2 + 1 qui correspond aux 
solutions y(x) = À cos(log |x|) + usin(log |[x|) + x/2 + 1. 

L'équation 22” — 2xy! + 2y = x + 1 conduit à l'équation 2” — 3z/ + 22 = £et + 1 et 
donc aux solutions de la forme : 2(t) = Àe!+ye?) —te!+1/2 qui correspond aux solutions 
y(x) = Ax| + ux° — (log |x|)|x| + 1/2. 

L'étude de la possibilité de raccorder deux solutions sur R* et R* est laissée en 
exercice. 


Exercice. (Méthode de variation des constantes pour les équations d’ordre deux). On 
souhaite calculer les solutions de 


(x) + a(x)y'(x) + b(x)y(x) = g(x) (E) 


lorsqu'on connait une base y1(x), y2(x) des solutions de l’équation homogène. En partic- 
ulier W(x) := y1(x)y2(x) — y2(æ)yi (x) est une fonction ne s’annulant pas. 


a) Montrer que si C1 et C2 sont deux fonctions dérivables vérifiant : 


Ciyi+Coy = 0 
Ciyi + Coye 


alors la fonction y(x) = Ci(x)y1(x) + C2(x)y2(x) est solution de l’équation (E). 


b) En déduire une expression de la solution générale de (E)) : 


ie (ai - [ Pat) Ye (a + [ LPLat) . 


où À, et A2 sont des constantes 
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CHAPITRE 21 FONCTIONS DE PLUSIEURS VARIABLES 


Nous avons jusqu'à présent étudié les fonctions d’une variable réelle. Si ce thème est 
très riche et utile, il est cependant très loin de permettre d’aborder la totalité des situa- 
tions. En effet on peut même dire que la plupart des phénomènes font intervenir plusieurs 
variables : un problème de thermodynamique (par exemple l’étude d’un gaz) fait inter- 
venir pression, température, volume, un problème d'économie fait souvent intervenir de 
très nombreux paramètres, etc. L'étude des fonctions de plusieurs variables s'impose donc 
naturellement, les lois de la nature s’écrivant le plus souvent comme des relations entre 
plusieurs quantités. Comme on va le voir certains aspects des fonctions à plusieurs vari- 
ables sont déjà présents dans l’étude des fonctions d’une variable, cependant elles font 
également apparaître des phénomènes nouveaux. D'un point de vue mathématique une 
première explication est que la topologie du plan, de l’espace (à trois dimensions) ou plus 
généralement de R” est nettement plus compliquée que celle de R. Ce point est suc- 
cintement développé, on va surtout s'attacher à traiter l’analogue du calcul différentiel 
(dérivées partielles, accroissements finis et formule de Taylor, extrema locaux et globaux) 
pour une fonction de plusieurs variables. La généralisation des équations différentielles 
“ordinaires” (EDO), c’est-à-dire pour les fonctions d’une variable, s'appelle naturellement 
“équations aux dérivées partielles” (EDP). Dans cette première approche les EDP sont 
à peine évoquées, mais on s’est efforcé de mentionner, lors d’exemples et d’exercices, au 
moins trois des EDP les plus importantes en physique : 


Af= +... +— — 5 L 
f Da? HT an 5x2 0 (équation de Laplace) 
20 f $ : ) 
Af-—c DE — 0 (équation des ondes, D’Alembert) 
Ô 
Af — 21 —Ù (équation de la chaleur ou de la diffusion, Fourier) 


Cependant l'étude générale des solutions de ces équations dépasse largement le niveau de 
ce cours. Cette partie du cours se termine avec une discussion des méthodes de calcul 
différentiel visant à déterminer les extrema d’une fonction de plusieurs variables. 


1. INTRODUCTION ET REPRÉSENTATION 


Soit U une partie de R”, une fonction f : U — R s’appelle une fonction de n variables. 
Par exemple les fonctions f(x,y,z) = x? + y? + 2? et g(x,y,2) = x? — y? — 2? sont deux 
fonctions (assez simples) de trois variables définies sur U = R*. La fonction A(x,y) — 
log(x? + y + 1)/(x — y) est une fonction de deux variables définie sur l’ensemble plus 
compliqué : 
U:={(x,y)eR’|r+y+1>0, et x £y}. 


L’analogue du graphe d’une fonction d’une variable est facile à définir. Si f : U — R est 
une fonction de n variables, on définit le graphe de f comme l’ensemble : 


Graphe, := {(x,y)EUXR | y= f(x)}. 
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Cependant on perçoit tout de suite une difficulté pour le dessiner : c’est un sous-ensemble 
de R"*! : or le tableau ou notre feuille de papier n’a que deux dimensions ! En utilisant 
les conventions visuelles de la perspective, on peut encore en partie représenter le graphe 
d’une fonction de deux variables (voir les exemples ci-dessous) mais cela devient impossible 
pour une fonction de 3 ou plus variables. On devra donc se contenter de représentations 
partielles. C'est-à-dire que, pour une fonction de 3 variables par exemple f(x,y,z2), on 
peut tracer soit un certain nombre de surfaces (qu’on pourra appeler “tranches” ) 


u = f(x, y,c), avec c fixé, 
soit tracer un certain nombre de surfaces de niveau i.e. les surfaces d’équation : 
f(x,y,2) = a, avec à fixé. 


Exemples. Montrons comment tracer le graphe de la fonction A(x, y) = x?—y?, c’est-à-dire 
la surface d’équation z — x? — y?. On trace la courbe intersection de la surface avec les 
plans æ = 0 et y — 0. Ce sont des paraboles dont l’une est renversée. En particulier on 
remarquera que le point (0,0) correspond à un minimum le long de la courbe obtenue en 
fixant y = 0 mais correspond à un maximum le long de la courbe obtenue en fixant x = (0. 


Remarque : cette surface a la forme d’une “selle”, ce qui justifiera d’appeler “point- 
selle” un point d’une surface ayant la même allure (on l’appelle aussi “col”). 


Considérons la fonction f(x, y, 2) = x? + y? + xyz. Le tracé de quelques “tranches” 
u = x? + y? + cxy (pour c fixé) donne : 


On obtient le tracé approximatif pour c = 0 en faisant tourner autour de l’axe vertical 
la parabole contenue dans le plan y — 0 d’équation u = x?. Le tracé des courbes de niveau 
2? + y? + xyz = a est laissé en exercice (choisir par exemple c = —3, c = 0 et c = 3). 
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Si l’on choisit maintenant g(x, y, 2) = æ°? — y? — 2?. Le tracé de quelques “tranches” 


u = x? — y? — c? (pour c fixé) donne : 


c=0 C=A 


Le tracé des courbes de niveau est également assez simple dans ce cas : il s’agit 


d’hyperboloïdes de révolution x? — y? — 2? = a : 


=; = a = —1 


Remarquons au passage qu’on a utilisé le mot “surface” en un sens que nous espérons 
être clair mais que nous n’avons pas défini. 


Nous allons maintenant étudier les questions de continuité et de dérivabilité, mais pour 
cela il faut faire un détour et étudier un peu plus le plan et plus généralement l’espace R”. 


2. UN PEU DE TOPOLOGIE DE R” 


La notion de continuité sur R a été étudiée à partir de la distance entre deux réels, qui 
permet de définir la notion de “tendre vers” ou de “limite”; il existe bien sûr une notion 
analogue de distance dans R” que nous rappelons. Notons (x + y) = æiy1 +...+ xnyn le 
produit scalaire de deux vecteurs de R”. Il est utile de se souvenir que (x-y) = 0 équivaut 
à dire que les vecteurs x et y sont orthogonaux. 


Définition: On appelle norme euclidienne d’un vecteur æ = (x1,...,21) de R” le 


nombre : 
all := (xx) = 1/22 +... + x2. 
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On définit la distance euclidienne entre deux vecteurs x = (x%1,...,24n) et y — (y1,...,Un) 
de R” par la formule : 


distance (x, y) := ||[x — y|| = {1 — y)? +... + (%n — Yn)?. 


L’analogue d’un intervalle (ouvert) de R qui s'écrit Ja —r,a+r-={xeR|lrx-a| <r}, 
est une boule (ouverte) de R” : on appelle boule (ouverte) de centre a € R” et de rayon r 
l’ensemble 

B(a,r):={xeR"|ffz-al <r}. 


Les principales propriétés de la norme euclidienne sont résumées dans la proposition sui- 
vante (les trois premières propriétés caractérisant les normes) vue au chapitre 11 en di- 
mension 2 et 3. 


PROPOSITION: La norme euclidienne sur R" vérifie pour tout x = (x1,...,%n) € R” 
(i) On a |x|| > 0 avec égalité si et seulement si x = 0; 


(ii) Pour a € R, on a |jax|| = ja[||x||; 
(iii) (inégalité triangulaire) ||x + y|| < ||x|| + [|yll. De plus on a l'inégalité de Cauchy- 
Schwarz : 


Ge: g)l= friga +2 + Gngnl <Ixl| lg. 


(iv) distance (x, y) > 0 (avec égalité seulement si x — y) 
(v) distance (x, y) < distance (x, z) + distance (z, y). 

Remarque. Dans le plan, on sait que, si 4 est l’angle entre les deux vecteurs x et y, 
alors (x: y) = cos ||x||[|y|| ; l'inégalité de Cauchy-Schwarz équivaut donc dans ce cas à 
| cos 0] < 1. 


Remarque. Il est quelquefois commode d'utiliser d’autres normes comme par exemple : 


ll = ri] +... + ral, ou encore [æ|l" = max (il. 


i=lan 
Les inégalités suivantes sont assez faciles à établir et sont laissées en exercice : 


IE 
el < el Salah et = <a <Ilrl. 


Vn 


Elles permettent de voir que ||x|| tend vers zéro si et seulement si ||x{|1 (ou [|[x||’) tend vers 
zéro. Par contre les boules n’ont pas la même forme : 


Boule |[|x|| < 1 dans R*, Boule |[|x||1 < 1 dans R*, Boule ||x||' < 1 dans R°. 
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On peut maintenant définir la notion de limite et continuité. 


Définition: Soit U contenant une boule centrée en x0 (dans R”) et soit f : U — R une 
fonction de n variables. On dit que f(x) tend vers { quand x tend vers 9 si on a 


Ve > 0, > 0,0 < ||x — xof| <ô = [f(x) —-£|<e. 


Si de plus £ — f(xo), on dit que f est continue au point 0. Si f est continue en tout point 
x EU, on dit que f est continue sur U. 


Les propriétés “usuelles” suivantes restent vraies (et se démontrent comme pour les fonc- 
tions d’une variables) : 
(i) La somme et le produit de fonctions continues sont encore continus. Les polynômes 
(à plusieurs variables) sont des fonctions continues. 
(ii) La composée de fonctions continues à plusieurs variables est encore continue. Plus 
précisément si f(u1,...,u\) est une fonction continue à n variables et si g;(æ1,...,%m) 
est une fonction continue à m variables pour 1 < à < n, alors la fonction 


Flat) tele sm) 


est une fonction continue à m variables. 


Exemple. La fonction h(x,y) = log(x?+y+1)/(x—y) est continue sur son domaine de 
définition. En effet on peut l'écrire en composant polynômes, fonction inverse (c’est-à-dire 
f(x) = 1/x) et fonction logarithme. 


Etudions deux exemples où la continuité est plus délicate et où il nous faut revenir à 
la définition. Considérons les deux fonctions 


_fzi sy) # (0,0) ro li si(x,y) # (0,0) 
De Cor TOYS DE UE x 


Par les mêmes arguments que précédemment, on voit que f et g sont continues en tout point 
de R? \{(0,0)}. La question de la continuité au point (0,0) est plus délicate. Montrons 
que g est continue au point (0,0) alors que f n’est pas continue au point (0,0). 

Pour montrer la continuité de g en (0,0) on doit montrer que g(x,y) devient arbi- 
trairement petit quand la norme de (x,y) devient petite. Pour voir cela on peut majorer 
24 + y < (x? + y?)? et donc écrire 


(x, y)| < x? + y? 


qui montre que g(x,y) tend vers 0 quand (x,y) tend vers 0. En effet dès que ||(x,y)|] — 
1/22 + y? < V/E on aura [g(x,y)| < €. 
Pour montrer que f n’est pas continue, on peut observer que, pour à fixé, 


2 


ax a 
li — li Rs 
En fe at) AE (1 + 1 0 1 + a? 
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existe mais varie avec à, et en particulier n’est pas toujours égale à f(0,0). 


Un peu de vocabulaire. Nous utiliserons le minimum de topologie de R” et nous 
concentrerons sur le calcul différentiel mais nous définissons néanmoins les notions suiv- 
antes abordées dans de nombreux ouvrages. Si a € À et À C R”, on dit que a est un 
point intérieur de À s’il existe une boule B(a,r) contenue dans À; l’ensemble À est un 
ouvert si tout point de À est intérieur (il revient au même de dire que À est réunion de 
boules ouvertes). Un élément a est dans la frontière (ou bord) de À si toute boule B(a,r) 
contient un élément de À et un élément hors de À. Un ensemble À est fermé si c’est 
le complémentaire d’un ouvert (il revient au même de dire que À contient sa frontière). 
L'ensemble À est borné s’il est contenu dans une boule: il est dit compact s’il est fermé et 
borné. Définissons enfin la notion d'ensemble n’ayant “qu’un seul morceau” : un ensemble 
ouvert À est connexe (ou “en un seul morceau”) si on ne peut pas l'écrire comme réunion 
disjointe de deux ouverts; cette propriété équivaut au fait que deux points de À peuvent 
être joints, à l’intérieur de À par une ligne polygonale (une suite finie de segments). 
Exemples et commentaires. Un ouvert de R est une réunion d’intervalles ouverts ; l’ana- 
logue d’un intervalle ouvert est un ouvert connexe. Les propriétés suivantes des fonctions 
continues se transposent : 

(i) Une fonction continue sur un ensemble compact (fermé, borné) est bornée et atteint 
son maximum et son minimum. 

(ii) Une fonction continue sur un ensemble connexe satisfait la propriété des valeurs in- 
termédiaires. 


3. DÉRIVÉES PARTIELLES 


La définition des dérivées partielles est assez simple : on fixe toute les variables sauf 
une et on calcule, si elle existe, la dérivée de la fonction d’une variable ainsi obtenue. Plus 
précisément : 


Définition: Soit f : U — R une fonction de n variables x = (x1,...,æ,) et soit 
a = (a1,...,an) un point de U tel que ÜU contienne une boule centré en a, on définit la 
dérivée partielle de f par rapport à la variable x; en a comme la limite suivante (si elle 
existe) : 


(a) tu f(a1, cs di], di + h,&;1, re 0) = f(az, 2 AUS 
Ox; h—0 h ‘ 


Si la fonction admet des dérivées partielles en tout point de ÜU, on peut considérer la 
fonction 2L (x) et étudier sa dérivabilité ; sa dérivée partielle par rapport à x; au point a 
ne note 


; ol 
(a) = lim D (Qi dj à + h, die du) = . 


pes) h 


(aise: 00) 


of 
OL OT: 


On peut bien sûr définir des dérivées partielles de n’importe quelle ordre mais nous 
n’utiliserons pas les dérivées d’ordre supérieur à 3. Nous utiliserons toujours la notation 
2r mais signalons que les notations f}. ou encore D;f sont également utilisées. 

T 
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On a vu que, pour une fonction d’une variable, l’existence de la dérivée en un point 
équivaut à l’existence d’un DL à l’ordre 1 en ce point. La situation est un peu plus 
compliqué en plusieurs variables. Ainsi la fonction f(x, y) = xy/(x?+y?) vérifie SE (0, 0j: 
SE (0, 0) — 0 sans que la fonction soit même continue! 


Définition: Une fonction f est différentiable en a € R? si elle admet un DL à l’ordre 1 
au voisinage de ce point, c’est-à-dire si il existe /; € R tels que : 


f(a+h) = f(a) + £iha +... + lhihn +e(h)llAl|, 
avec limy_,0€(h) = 0. La forme linéaire g(h) := £1h1 +...+44h, s'appelle la différentielle 
de f en a. 


On voit facilement que, si f est différentiable, elle admet des dérivées partielles et on 
a L; = 2L (a). On verra plus loin que, si f admet des dérivées partielles continues, alors 
elle est différentiable. 

Remarquons qu’il est dénué de sens de demander si une fonction de deux ou plusieurs 
variables est croissante ou non (il n’y a pas d’ordre naturel sur les couples de réels). On peut 
néanmoins se donner une direction (i.e. restreindre la fonction à une droite) et regarder si 
la fonction est croissante ou non dans cette direction. Ceci suggère d’introduire la notation 
suivante. 


Définition: Soit f une fonction admettant des dérivées partielles en a, on appelle 
gradient de f en a le vecteur de R” donné par : 


mûd/(o) = (£a... 20). 


Ot1 7 ‘Otn 


Si f est différentiable au point a on peut donc écrire : 
f(a+h) = f(a) + (gradf(a) -k) +e(h)|lHI}, 


On constate alors que l’hyperplan affine d’équation z = f(a) + (gra f(a) - (x — a)) est 
l’hyperplan approchant le mieux l’hypersurface z = f(x). 


Si par exemple, f(x,y,z) est une fonction différentiable de trois variables, le plan 
tangent à la surface de niveau f(x,y,2) = À en (x0, Yo, Zo) a pour équation : 


0) 0) 0) 
DL (to vo, 20) — 0) + Dao vo, 20)(y — vo) + GE (ro de) — 20) = 0. 
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En particulier, on constate que le vecteur gradient grad (to, Yo, 0) est orthogonal au plan 
tangent de la surface de niveau. 


Exemple. Considérons la fonction f(x, y) = x cos(x? + yx). Ses dérivées partielles se 
calculent avec les règles de calcul de dérivées ordinaires (à une variables) en prenant soin 
de garder fixe une des deux variables; on obtient 


3: y) = cos(x°? + yr) — x (2x + y)sin(x? + yr) 
SL (u,2) = 2? sin(r? + y) 
y 
of : 2 2 2 
a2 y) = —(6x + 2y) sin(x* + yx) — x(2x + y)” cos(x* + y) 
Ca Sn 2 2 
105 y) = —-2xsin(x + yx) — x (2x + y) cos(x + yx) 
2 
Dr a y) = —x° cos(x? + yx) 
of 


Onde y) = —2x sin(x° + yx) — (2x° + xy)r cos(x? + yx) 


of OT . : Ù 
On remarque que, Sur cet exemple on a Duôz Cu) = Dxôy (x, y) ; on va voir que ce n’est 
pas une coïncidence. 


THÉORÈME: (Théorème de Schwarz) soit f une fonction de deux variables, deux fois 
continûment dérivable, alors on a : 

®f 

— b). 


Démonstration:  Posons F(x) := f(x,b + k) — f(x,b) et G{y) := f(a+h) — f(a,y), 
alors on à 


A:= f(a+h,b+k)- f(a+h,b)— f(a,b+k)+ f(a,b) = F(a+h)-F(a) = G(b+k) -G(b). 


On applique une première fois le théorème des accroissements finis (en une variable) en 
remarquant que F'(x) — Ex, b+k)— (x, b) donc 


A=RhF'(a+60h)=h of ui + 01h, b) . 
Ox O$ 
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Une deuxième application du théorème des accroissements finis (en une variable) à la 


fonction H(y) — SE (a + 01h,y) qui a pour dérivée H'(y) = LL (a + 01h,y) donne 
A = hkH'(b+602k) = hk Gel (a + 01h,b + 02k) 
= 2R) — Oyox (02 1, 2). 


Un raisonnement symétrique à partir de la fonction G donnerait 


af 


A jen) 
“ Ox0y 


(a + 03h, b + Oak). 


On obtient ainsi l’existence de 01, 02,03, 04 €]0, 1[ (dépendant de h et k) tels que 


of 
OyOx 


ol 
_ Orôy 


(a+ 61h,b + 602k) (a + 603h,b + 84k). 
En faisant tendre À et k vers zéro et en utilisant la continuité des deux dérivées secondes 
on obtient alors le résultat escompté : 


æf 
Oyôx (a, b) — 0x0 y (a, b). 


Exercices. 1) On définit une fonction de n + 1 variables par la formule 
Fan dnt) = 17/2 exp(—|læ|[?/4t). 


Déterminer le domaine de définition de F, calculer les dérivées partielles jusqu’au second 
ordre et montrer que F vérifie l'équation de la chaleur (ou équation de diffusion ou équation 


de Fourier) : 
OF  dF OR, GOT o 


to "52 Ô 


2) Soit f,g deux fonctions d’une variable deux fois dérivables. Montrer que la fonction 
F(x,t) = f(ex +t) + g(cx — t) vérifie l'équation aux ondes 


ŒF  ,02F 
de gere 


Quelle interprétation physique peut-on donner à ce fait ? 
3) Soient f,g deux fonctions dérivables de n variables, montrer les formules suivantes : 


grad(f + g)(a) = gradf(a) + gradg(a) 
grad(fg)(a) = g(a)gradf(a) + f(a)gradg(a) 


gd (2) (0 = = (toeaf(a) - Fosrädg(a) 
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Donnons maintenant en trois variables une des principale règles de calcul des dérivées 
partielles de fonctions composées (il n’y a pas de difficultés à faire ces calculs avec un autre 
nombre de variables). 


THÉORÈME: Soit f(u,v,w) une fonction de trois variables ; soient u(t), u(t),w(t) trois 
fonctions d’une variable et posons F(t) — f(u(t),v(t),w(t)). Si u,v,w sont continûment 
dérivables et f également, alors F est continûment dérivable et : 


Of Of 


| of 
CU) 0) (D) + v' (D 


F'(#) = u/(t) SL (u(#),o(t)w(e)). 


(u(£),v(#), w(E)) + w(#) 


Démonstration: Posont a(t) — (ut), v(t),w(t). Comme u,v,w sont continûment 
dérivables on à u(t + h) —u(t) = w(t+01h)h = u'(t)h+e(h)h (et de même pour v et w). 
On peut écrire 


fCu(t +h),b,c) — f(u(t),b,c) = —-(u(t) +e(h),b,chu/(t + 6h)h. 
D'où l’on tire 


F(t+h)-F(t)=f(ut+h),vt+h),;w(t+h)) — f( 
=f{utt+h),v(t+h);w(t+h)) — f(u(t),v(t+h),w(t+h)) 


+ f{u(t),v(t+h),w(t+h)) — f(u(t),v(t),w(t+h)) 
+ f(u(),v(t), w(E+R)) — —f(u(),v(E), w(E)) 
= CL (ut) +a(h),v(t+h),w(t+h)ju'(t+6:1h)h 
+ SL ut v(D + eh), w(t+h))v'(t+602h)h 
+ AL (u(E),v(#), we) + e3(h))w'(t + 603h)h 
= (EE (at) + 20 BE (AO) + w'(O ZE (at) ) n + ee 
d’où le résultat. 
Dèns. lé és où Fous) = Julia dar) le “Tormulé 
générale” s’écrirait, : 
OF T Ou; Of 
An LM Tad= 2 Fe (ses: en) Cr, ON UE En UE 


APPLICATION : Calcul du Laplacien en coordonnées polaires et sphériques. 


198 


Les coordonnées polaires dans le plan peuvent être définies par les formules (x, y) — 
(r cos(0),rsin(4). Si f(x,y) est une fonction de deux variables et si l’on pose g(r, 0) : 
f(r cos(), r sin(0)), alors le théorème précédent permet de calculer 


0g Of  . Of 0g _ Of Of 

re s(4) de + ne, 6 — rsin(8)= + r cos(Ô) dy 

®g Le. 2 of LEE ;. "9 ci 

32 — COS QE) + 2 cos(0) sin(0) 10 + sin QE) 

dg 902 0? 2 CA Ds 12 of Of ‘ 
ge? =" Sin QE) — 2r° cos() sin(0) Dx0y + r‘ cos QE — r cos(0)= — rsin(g)= 


et de vérifier : æ æ D . D 
1 1 
a. 8e Del, Le 
Oy Or r Or Tr? 00 
En particulier, une fonction radiale (c’est-à-dire indépendante de 0) et harmonique (c’est- 
à-dire avec laplacien nul) vérifie donc l’équation différentielle ordinaire 


g'(r)+r°g'(r) =0, 


ce qui entraîne g'(r) = Ci/r puis g(r) = Ci logr + Co. 


Exercice. On définit également les coordonnées sphériques dans R>° par les formules 
(x, y, z) = (r cos() cos(0), r cos() sin(0), r sin()) 


correspondant géométriquement à la figure ci-dessous : 


Coordonnées sphériques (r, 0, ). 


Si f(x,y,z) est une fonction de trois variables et si l’on pose 
g(r,0,@) = f(r cos(@) cos(0),r cos(d) sin(@), r sin(@)), 


vérifier la formule 


2 2 2 
xs ON 0 on 
Ox?  Oy? Oz? 
dg  20g 1 dg  1°g te(é) 0g 


7 @r? id r Or Le r2 cos2(@) 002 LE r2 0@? r2 0 
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En déduire l’expression des fonctions radiales de laplacien nul sur R3 \ {0} (on trouve 
g(r) = Ci + Ca/r). 


Plus généralement, posons r := 4/x? +...+2x2 et f(æ1,...,%n) := g(r). Montrer que 


Af(t1,...,Æ€n) = g’(r) + 
et en déduire que les fonctions radiales harmoniques en n > 3 variables ont pour expression : 


fi: sa) — Ci Our are —= Ci + 


THÉORÈME: (Théorème des accroissement finis) Soit f : U — R une fonction 
continüment dérivable ; soient x = (x1,...,%n) et y = (y1,...,Yn) deux points de U tels 
que le segment joignant x à y soit inclus dans U alors il existe un point c de ce segment 
tel que : 


- Ô 
f(x) — f(y) = gradf(c) - (x — y) = (es mu) ++ (c)Gr — Un). 
En particulier on l’inegalité suivante 


FC) — fu) < MIx — y|) 


où M est un majorant de ||gradf|| sur le segment joignant x à y. 


Démonstration:  Posons g(t) = f(y +t(x — y)), alors g est une fonction d’une variable 
réelle & dont la dérivée peut se calculer comme fonction composée : 


Of of 
JE) = (y + te — y) — gi) +... + (y + (x — y))(En — Yn). 
Ox: OX 
La dérivée de g est continue et on peut lui appliquer le théorème des accroissements finis 
(en une variable) et conclure qu’il existe to € [0,1] tel que g(1) = g(0) + g'(to), ce qui 
donne la première formule avec c = x +to(x — y). Pour obtenir la majoration, on applique 


l'inégalité de Cauchy-Schwarz : |(grad (0) - (x — y))| < [Igradf(c)|||[e — yll © 


Remarques. 1) L'hypothèse que le segment [x,y] soit contenue dans U ne peut pas 
être enlevée (voir par exemple l’exercice à la fin de ce chapitre). 2) Cet énoncé permet de 
voir qu’une fonction admettant des dérivées partielles continues est différentiable. 


COROLLAIRE: Soit f : U — R une fonction continûment dérivable. Soit a € U tel 
que U contienne une boule centrée en a. Soit à € R”, alors la fonction g(t) = f(x + tü) 
est croissante en t = 0 si et seulement si 


(gra f(x) 7) 0, 
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Démonstration: Soit h un vecteur de norme plus petit que le rayon de la boule de 
l'hypothèse, le théorème nous garantit l’existence d’un réel 9 € [0,1] tel que 


of of 
Ori 


fa+h)— f(a) = gradf(a + 8h): h = (a + 8R)h1 +... + (a+ 6h)hn. 


tn 


En remplaçant À par {0 (pour t assez petit) on obtient 


f(a + #9) — f(a) = gradf(a + 660) - to = t ((grad(a) sé e(e)) 
d’où le résultat. D 


COROLLAIRE: Soit f : U — R une fonction continüment dérivable. Soit a € U 
tel que U contienne une boule centrée en a et sur laquelle f admet un maximum ou 
un minimum en à (c’est-à-dire que a est un extremum local pour la fonction f), alors 


gradf (a) = 


Démonstration: En appliquant le corollaire précédent à Ÿ et —v on voit que le produit 
scalaire gradf(a) + ü est nul. Le seul vecteur orthogonal à tous les vecteurs de R’ est le 
vecteur nul. [ 


Définition: Un point a où grad f (a) — 0 sera appelé point critique de f. 


Remarque. Une fonction différentiable sur un fermé borné (par exemple une boule 
fermée ||[x — a|| < r) atteint donc son maximum soit en un point du bord, soit en un point 
critique de l’intérieur (par exemple de la boule ouverte [x — all < r). 


COROLLAIRE: Soit f : U — R une fonction continüment dérivable telle que pour 
tout x € U on ait gradf(x) — 0. Supposons de plus que deux points de U puissent être 
joint par une ligne polygonale dans U, alors la fonction f est constante sur U. 


Démonstration: Il suffit de démontrer que f est constante sur un segment contenu 
dans U et ceci est clair à partir du théorème précédent. 


Remarque. L’hypothèse sur ÜU est nécessaire comme le montre l’exemple suivant. 
Considérons la fonction 


f(x, y) = Arcte(x/y) + Arcte(y/x). 


On calcule aisément et on vérifie que (x, y) = 5 Gé, 0)-="0 "pourtant: fl 
et f(—1,1) = —7. Le problème vient de ce que l’ouvert de définition U = {(x,y) € 
R? x 20 et y 0} est constitué de 4 morceaux. Sur le quadrant supérieur droit 
U={(x,y)ER?|x>0 et y>0}ona f(x,y) = 7 ; sur le quadrant supérieur gauche 
Ur = {(x, y) ER? |x<0 et y>0}on a f(x,y) = —r ; sur le quadrant inférieur 
gauche U3 = {(x,y) ER? x <0 et y<O0}ona f(x = 7 et sur le quadrant inférieur 
droit Us = {(r,y ER? x >0 et y<O0}ona f(x,y) — 


201 


4. EXTREMA 


Nous avons vu qu’une fonction dérivable d’une variable ne peut avoir un extremum 
local qu’en un point ou sa dérivée s’annule ou en une extrêmité de l’intervalle ; de plus la 
considération de la valeur de la dérivée seconde (et d’ordre supérieur) permet en général 
de préciser si le point où la dérivée s’annule est bien un extremum ou non. Le point clef 
de la preuve était le développement de Taylor 


2 
Fo + h) = F0) + F'(o)h + Pro) + (HA? 

qui permet de dire que, si f”(xo) Z 0, la fonction f se comporte au voisinage de +9 comme 

le polynôme f(x0)+ f'(xo)h+ f”(xo)h?/2. Nous allons voir que l’analogue de ces résultats 

persiste en plusieurs variables. Tout d’abord donnons l’analogue de la formule de Taylor à 

l’ordre 2. Pour simplifier les notations et les calculs, nous écrirons la plupart des énoncés de 

ce paragraphe en 2 variables mais l’essentiel s’adapte sans difficulté au cas de n variables. 


THÉORÈME: (formule de Taylor à l’ordre deux) Soit f : U — R une fonction de deux 
variables deux fois continûment dérivable au voisinage du point x = (x0, yo) € U. 


Fo + hu + 8) = (ro vo) + Eh + SEE 


1 {&f @} of 
D (Eco + 2 DE can + PEN) + cn, RQ + #9 


où e(h,k) est une fonction qui tend vers zéro quand (h,k) tend vers (0,0). 


Bien sûr 2! est égal à 2 et nous l’avons écrit ainsi uniquement pour suggérer que la 
formule à l’ordre 3 ferait intervenir un coefficient 1/3!, etc. 


Démonstration: Comme pour la preuve du théorème des accroissement finis, on pose 
g(t) = f(xo +th,yo +tk). Au vu des hypothèses, la fonction g est deux fois dérivable et : 


Ô Ô 
: 0? 0? 
g"(t) = _e Pen. yo + tk)h? + 2 D (eo + th yo + tk)hk + = ae 


Oy? 


à (to + th, yo + tk)k? 


et, en appliquant la formule de Taylor à l’ordre 2 à g on obtient 
1 
g(1) = g(0) + g'(0) + 79 (to), pour un to € [0,1]. 


Il suffit maintenant d'observer que, comme les dérivées partielles secondes sont continues, 
on à par exemple 


(6 ES à Of 


DK0y —— (to + toh, yo + tok) = Bron (xo, Yo) + E(h,k) 


202 


d’où le théorème. D 


Ce théorème permet essentiellement de ramener l’étude locale en (x9, yo) à celle de la 
fonction quadratique 
oi 


g(h, k) := as (eh 49 


®f 
Ox0y 


of 
(x)hk + A CALE 


On peut étudier ce polynôme homogène de deux variables essentiellement comme un 
polynôme de degré 2 en 1 variable (ici le cas de deux variables est un peu plus simple) de 
la façon suivante. Posons 


10 ®f 


ne Lo 
ne 32 &)  Grôn (x), 


= 97 ®) 


et 


de sorte qu’on veut étudier g(h,k) = ah? + 2bhk + ck?. Si a Z 0 on peut remarquer que 


à 2 bre nes br. 
g(h,k) = ah° + 2bhk + ck =aft+ ak) + Æ k le 

On voit immédiatement qu’il faut distinguer suivant le signe de À = b? — ac ; on obtient : 

(i) Si À < O0 alors g(h,k) ne s’annule que pour (h,k) = (0,0) et si (h,k) Z (0,0) alors 
g(h,k) est du même signe que a. Ainsi on obtient un maximum (resp. un minimum) 
en (h,k) = (0,0) si a < 0 (resp. si a > 0). 

(ii) Si À > 0 alors g(h,k) s’annule le long de deux droites et prend des valeurs positives 
et négatives de part et d’autre de ces deux droites. Il n’y a pas d’extremum. 

(iii) Si À = 0 alors g(h,k) s’annule le long d’une droite et chaque point de cette droite 
est un extremum pour la fonction g(h,k). On dit que la forme quadratique g est 
dégénérée. 


Traçons le graphe z = g(h,k) dans quelques exemples 


(à), g(h,k) = 2 + hk + k2 (ii), g(h, k) = R? + 3hk + 2k2 (é), g(h,k) = (h — k)? 


Nous allons démontrer “à la main” une propriété générale des formes quadratiques qui 
nous sera utile pour le théorème suivant; le lemme dit qu’une forme quadratique positive 
se comporte comme x? + y?. 


LEMME: Soit Q(x,y) = ax? +2bxy + cy? une forme quadratique avec À := b? — ac £ 0. 
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(i) Si À < 0, alors il existe une constante C > 0 (ne dépendant que de à, b, c) telle que, 
si a > 0 alors Q(x,y) > C(x? + y?) et si a < 0 alors Q(x, y) < —C(x? + y?). 
(ii) Si À > 0, alors il existe C > 0 et À, u tels que Q(x, Àx) > Cx? et Q(x,ux) < —Cx?. 


Démonstration: Dans le cas (4), si b — 0 on peut prendre € = max{lal,|c|}; si 
b Æ 0 on peut reprendre l'expression Q(x,y) = a {(x + by/a)? — Sy}. Distinguons le 
cas où [by/a| < |x/2| alors x? + y? < (1 + a?/4b?)x? et (x + by/a)? — Sy? = leo 
d’où l'inégalité cherchée. Dans le cas où |by/al > |x/2| alors x? + y? < (1 + 2b?/a?)x? et 
(x + by/a)? — Sy? > — Sy? d'où l'inégalité cherchée. Dans le cas (ii) il suffit de choisir À 
et u tels que Q(1, À) > 0 et Q(1,u) <0. D 


Ces propriétés permettent de prouver le théorème suivant. 


THÉORÈME: Soit f : U — R une fonction de deux variables deux fois continüment 
dérivable au voisinage du point x = (x0,yo) € U. Supposons grad f(x0, yo) = 0 et posons 


Of Of of 
= = t = = 
a RO, be REG) € ce EU) 
Alors on a : 
(i) Supposons À := b? — ac < 0. Si a < 0, alors f(x,y) admet un maximum local en 


(to, Yo) ; si a > 0, alors f(x,y) admet un minimum local en (xo, yo) ; 

(ii) Si A :=b?— ac > 0 alors f(x, y) ne possède pas d’extremum local en (xo, yo). On dit 
que f admet un “point-selle” en (x, yo). 

(ii) Si À = 0 on ne peut pas conclure sans autres considérations. 


Démonstration: Sous les hypothèses, la formule de Taylor s’écrit : 


f(&o + À, yo + k) — f(x, yo) = + (ah? + 2bhk + ck?) + eh, k)(R? + k?). 


DNIH 


Dans le cas (i) avec disons a > 0 on peut écrire, en utilisant le lemme précédent : 


Fa + han +) = Jean) 2 (TS + eh.) (HP +28) 


qui montre bien que la fonction admet un minimum local en (x6, yo). On procède de même 
si a < 0. Dans le cas (ii) on observe que 


Fa + ego + A) — rose) 2 (+ ea) 


alors que 
—C 
Fa + ho +) — ant) € (EE + és) 
ce qui montre bien que le point (xo,yo) ne peut être un extremum. D 
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Exemple. Recherchons les extrema de la fonction f(x,y) = (x? — pe. La 


2 
fonction admet des dérivées continues à tout ordre donc on sait a priori que TE ÉGuT= 


2 
_. (x, y). Le calcul des dérivées ne présente pas de difficulté, on trouve: 


) = (22 — 2x(2? — p)je = 2x1 — 2? + jet 

à x? y? on 
Of : : : a. 
329) = (2-62 +2" — 2x(2x — 2° +2ay je? 

LE Ee of 

Ox0y Mo OyOx 
of 
Op? 


2 


2 


(æ,y) = (4xy — 2y(2x — 22° + 2æy°))e 7 Y 
(ay) = (-2— 227 + 6ÿ? — 2y(—2y — 2yr? + 2y$))e ® 


Comme la fonction exponentielle ne s’annule jamais, l'équation d’un point critique 
s'écrit t(1 — x? + y?) = y(1 + x? — y?) = 0. Comme 1 + x? — y? = 1 — x? + y? = 0 est 
impossible, on obtient x = y = 0 ou x = 1 + x? — y? = 0 ou y = 1 — x? + y? = O0, soit 
encore (x,y) = (0,0) ou (0,+1) ou (+1,0). Il y a donc 5 points critiques. 

Pour conclure, on évalue les dérivées secondes en chacun des points critiques; notons 
di DL (x, y), b= EE (æ,w), = DE (x, y) et À := b? — ac. 

En le point (x,y) = (0,0), on obtient a = 2, b = —2, c = 0 et À = 4 donc on 
est en présence d’un point-selle. En le point (x,y) — (+1,0), on obtient a — —4/e, 
b — 0, c = —4/e et À = —16/e? donc on est en présence d’un maximum. En le point 
(x,y) = (0,+1), on obtient a = 4/e, b = 0, c — 4/e et À — —16/e? donc on est en 
présence d’un minimum. | On peut remarquer que, comme f tend vers zéro quand (x, y) 
tend vers l'infini, le maximum de f est donc f(+1,0) = e-! et le minimum de f est donc 
f(0, +1) = —e-1]. 


Nous terminons ce chapitre en considérant le problème un peu plus général suiv- 
ant dit des “extrema liés. Le problème consiste à déterminer les extrema d’une fonction 
f(x1,...,Tn) où les variables 71,...,%, sont restreintes en leur imposant une condition 
g(æ1,...,%n) = 0. Le théorème de Lagrange suivant est le résultat central. 


THÉORÈME: Soit f,g deux fonctions continâment dérivables U — R. Si la fonction 
f, avec les variables contraintes par g(x1,...,1,) — 0, admet un extremum local en a alors 
il existe un réel À (appelé multiplicateur de Lagrange) tel que 


gradf(a) = À gradg(a). 
Nous donnons ci-dessous une intuition géométrique et également une démonstration sous 
l'hypothèse (à vrai dire peu restrictive) que l’on peut remplacer l’équation g(x1,...,æ») = 0 


par une équation du type æn = h(t1,...,Tn—1). 
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Interprétation géométrique. Nous allons pouvoir faire un dessin si le nombre de vari- 
ables est 2 ou 3. Soit a — (a1,a2) où la fonction f(x,y) atteint un extremum sous la 
contrainte g(x, y) = 0. Traçons les deux courbes C1 : f(x, y) = f(a1,a2) et C2 : g(x, y) = 0: 
si les tangentes à C et C2 en le point (a1,a2) ne sont pas confondues, c’est-à-dire si grad f(a) 
n’est pas colinéaire avec gradg(a), un petit déplacement le long de la courbe C2 fera tra- 
verser la courbe de niveau C1, ce qui contredit (au moins visuellement) l'hypothèse d’un 
extremum local. 


Le même raisonnement peut se visualiser avec deux fonctions de trois variables et les 
surfaces S1 : f(x, y,z) = f(a1,a2,a3) et So : g(x, y, z) = 0. 


Démonstration: Si l’on suppose g(t1,...,%n) = Zn — h(t1,...,Tn-_1) et on pose 
x! = (%1,...,Tn-_1) on peut écrire 
= Oh Oh 
radf(x) = [—-——(x),...,-— A) e 
gd/(o) = (2. (1) 
En remarquant que, sous la contrainte g(x1,...,2n)—=0ona 


Pis) = frs ir ss te 0 


on voit qu’un extremum local ne peut exister que si les dérivées de la fonction de droite 


par rapport à æ1,...,%n-1 S annulent, c’est-à-dire si : 
LR ARE :. OT Oh CLEMENT, 
Ox1 Ot10€n  Otn_1  Otn-10€n 


ce qui donne bien, en posant 0 f0x, (x) = À : 


: b > 2 
grad f(x) = D (x) gradg(x) = \gradg(x). 


[1 


Exemples. Soit trois réels 0 < € < b < a, on cherche le vecteur le plus long situé sur 
l’ellipsoïde d’équation : 
2 2 2 
Lu y CRE 
Solution. Le problème se ramène à chercher les extremums de f(x,y,2) := x? + y? + 2? 
sous la contrainte g(x,y,z) — 1 = 0. Le théorème nous garantit qu’un tel extremum ne 


206 


peut survenir qu’en un point où il existe À € R tel que gradf(x. A \gradg(x, y, 2) ou 
encore 


2 2 2 
(22 29,2) = À ( : L :). 


a b2 ce? 


Si x est non nul on en tire À = a? et ensuite y = z = 0 donc en fin de compte (x,y,2) = 
(+a,0,0); de même si y est non nul on obtient (x,y,z) = (0,+b,0) et si z est non nul 
on obtient (x,y,2) = (0,0,+c). On vérifie alors aisément que f(+a,0,0) = a? est bien le 
maximum et f(0,0,+c) = c? le minimum. Ce que l’on peut “voir” sur le dessin suivant. 


L’ellipsoïde L + ca + : = 


Exercice/exemple. Considérons la région du plan U := {(x,y)€ER?|yZ0 ou x> 
0} que l’on peut recouvrir par trois ouverts U1 = {(x,y) € R? | y > 0}, U2 = {(x,y) € 
R?|x>0}et Uz = {(x,y) € R? | y < 0}. Définissons les trois fonctions 


fi(æ,y) += Arcta(æ/1) pour (,y) € Ur 
feu): 5 — Arcte(y/#) pour  (e,y) € Un 
Bey) :=7+Arcte(a/y) pour (2) EU 


Vérifier que ces trois fonctions se recollent pour donner une fonction f : U — R, c’est-à- 
dire que f1(x, y) = f2(x, y) pour (x, y) € U1 UU et ainsi de suite et que f est harmonique, 
1.e. : 

Of OT 


Montrer de plus que, si æ < 0, alors 


lim, f(æ,€) = —-x/2 


e—0 


lim f(x,e) = +37/2 


e—0 
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Remarques. 

(i) On observera en particulier que l'inégalité du théorème des accroissements finis (dont 
les hypothèses ne sont pas vérifiées dans ce cas) est en défaut; en effet l’accroissement 
[f(x,e) — f(x, —e)| ne tend pas vers zéro quand € tend vers zéro. 

(ii) Cette fonction permet de construire une solution de l'équation de Laplace Ag(x, y) = 0 
sur U avec condition au bord g(x,0*) = +1 et g(x,07) = —1 pour x < 0 : il suffit 
de prendre g(x,y) = x !(x/2 — f(x,y)). Ceci permet de modéliser par exemple un 
potentiel électrique correspondant à une barre (l’axe des réels négatifs) avec une charge 
+1 au dessus et une charge —1 en dessous. 
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